数据挖掘的分析软件和展现工具

数据分析工具分红两个维度:
第一维度:数据存储层——数据报表层——数据分析层——数据展示层
第二维度:用户级——部门级——企业级——BI级web

存储层:数据库

咱们必须可以存储数据,对我的来说至少应该掌握一种数据库技术,固然也不必定要熟练操做,但至少要可以理解数据的存储和数据的基本结构和数据类型,好比数据的安全性、惟一性、冗余性,表的关系,粒度,容量等,最好可以理解SQL查询语言的基本结构和读取等等!

Access200三、Access07等:这是最基本的我的数据库,常常用于我的或部分基本的数据存储;
MySQL数据库,这个对于部门级或者互联网的数据库应用是必要的,这个时候关键掌握数据库的库结构和SQL语言的数据查询能力;
SQL Server 2005或更高版本,对中小企业,一些大型企业也能够采用SQL Server数据库,其实这个时候自己除了数据存储,也包括了数据报表和数据分析了,甚至数据挖掘工具都在其中了;
DB2,Oracle数据库都是大型数据库了,主要是企业级,特别是大型企业或者对数据海量存储需求的就是必须的了,通常大型数据库公司都提供很是好的数据整合应用平台;
BI级,实际上这个不是数据库,而是创建在前面数据库基础上的,这个主要是数据库的企业应用级了,通常这个时候的数据库都叫数据仓库了,Data Warehouse,创建在DW级上的数据存储基本上都是商业智能平台,或许整合了各类数据分析,报表、分析和展示!

第二:报表层
当企业存储了数据后,首先要解决的报表,还不是分析问题,是要可以看到各类各样的报表!国内外有专门提供报表分析服务的企业和软件。编程

Crystal Report水晶报表,Bill报表,这都是全球最流行的报表工具,很是规范的报表设计思想,早期商业智能其实大部分人的理解就是报表系统,不借助IT技术人员就能够获取企业各类信息——报表。并且不少数据库内置的报表也是采用CR报表的开发版嵌入的!
Tableau软件,这个软件是近年来很是棒的一个软件,固然它已经不是单纯的数据报表软件了,而是更为可视化的数据分析软件,由于我常常用它来从数据库中进行报表和可视化分析,先暂列在报表层;

第三:数据分析层
这个层其实有不少分析工具,固然咱们最经常使用的就是Excel,我常常用的就是统计分析和数据挖掘工具;安全

Excel软件,首先版本越高越好用这是确定的;固然对Excel来说不少人只是掌握了5%Excel功能,Excel功能很是强大,甚至能够完成全部的统计分析工做!可是我也常说,有能力把Excel玩成统计工具不如专门学会统计软件;
SPSS软件:当前版本是18,名字也改为了PASW Statistics;我从3.0开始Dos环境下编程分析,到如今版本的变迁也能够看出SPSS社会科学统计软件包的变化,从重视医学、化学等开始愈来愈重视商业分析,如今已经成为了预测分析软件。
Clementine软件:当前版本13.0,数据挖掘工具,我从6.0开始用,到了13版,已经愈来愈多的提升了更多有好的建模工具,如今更名叫PASW Modeler 13建模器了。并且与SPSS统计功能有了更多的整合,数据处理也更加灵活和好用。
SAS软件:SAS相对SPSS其实功能更强大,SAS是平台化的,EM挖掘模块平台整合,相对来说,SAS比较难学些,但若是掌握了SAS会更有价值,好比离散选择模型,抽样问题,正交实验设计等仍是SAS比较好用,另外,SAS的学习材料比较多,也公开,会有收获的! 

JMP分析:SAS的一个分析分支
XLstat:Excel的插件,能够完成大部分SPSS统计分析功能
Ucinet社会网分析软件:SNA社会网络分析是很是流行和有价值的分析工具和方法,特别是从关系角度进行分析社会网络,关系分析很是重要,过去咱们都是属性数据分析

Clementine软件或SAS的挖掘工具
K-Miner网络

第四:表现层svg

表现层也叫数据可视化,以上每种工具都几乎提供了一点展示功能。FineBI和Tableau的可视化功能上文有提过。其实,近年来Excel的可视化愈来愈棒,配上一些插件,使用感更佳。PPT:办公经常使用,用来写数据分析报告;
Xmind&百度脑图:梳理流程,帮助思考分析,展示数据分析的层次;
Xcelsius软件:Dashboard制做和数据可视化报表工具,能够直接读取数据库,在Excel里建模,互联网展示,最大特点仍是能够在PPT中实现动态报表。工具

数据可视化:Tableau & Echarts学习

若是说前面2条是数据处理的技术,那么在现在“颜值为王”的如今,如何将数据展示得更好看,让别人更愿意看,这也是一个技术活。比如公司领导让你对某一个项目得研究成果作汇报,那么你不可能给他看单纯的数据同样,你须要让数据更直观,甚至更美观插件

如何理解数据可视化?像咱们之前上学的时候学过的柱状图,饼状图,也是数据可视化的一种。只是在如今,简单的柱状图已经不能知足工做所需。目前比较流行的商业数据可视化工具是Tableau & Echarts。设计

Echarts是开源的,代码能够本身改,种类也很是丰富,这里很少作介绍,能够去建立一个工做区了解下。