简单来讲,咱们能够把大数据分析工具简单分红两个维度:数据库
第一维度:数据存储层——数据报表层——数据分析层——数据展示层编程
第二维度:用户级——部门级——企业级——BI级工具
一、数据存储层学习
数据存储涉及到数据库的概念和数据库语言,这方面不必定要深钻研,但至少要理解数据的存储方式、数据的基本结构和数据类型。SQL查询语言必不可少,精通最好。可从经常使用的select查询,update修改,delete删除,insert插入的基本结构和读取入手。开发工具
Access2003. Access07等 ,这是最基本的我的数据库,常常用于我的或部分基本的数据存储;MySQL数据库,这个对于部门]级或者互联网的数据库应用是必要的,这个时候关键掌握数据库的库结构和SQL语言的数据查询能力;大数据
SQL Server 2005或更高版本,对中小企业, - -些大型企业也能够采用SQL Server数据库,其实这个时候自己除了数据存储,也包括了数据报表和数据分析了,甚至数据挖掘工具都在其中了;spa
DB2,Oracle数据库都是大型数据库了,主要是企业级,特别是大型企业或者对数据海量存储需求的就是必须的了, 通常大型数据库公司都提供很是好的数据整合应用平台;插件
BI级别,实际上这个不是数据库,而是创建在前面数据库基础上的,企业级应用的数据仓库。DataWarehouse,创建在DW级上的数据存储基本上都是商业智能平台,整合了各类数据分析,报表、分析和展示! BI级别的数据仓库结合BI产品也是近几年的大趋势。设计
.在入门学习大数据的过程中有碰见学习,行业,缺少系统学习路线,系统学习规划,欢迎你加入个人大数据学习交流裙:251956502 ,裙文件有我这几年整理的大数据学习手册,开发工具,PDF文档书籍,你能够自行下载。接口
二、报表层
企业存储了数据须要读取,须要展示,报表工具是最广泛应用的工具,尤为是在国内。传统报表解决的是展示问题,目前国内的帆软报表FineReport已经算在业内作到顶尖,是带着数据分析思想的报表,因其优异的接口开放功能、填报、表单功能,可以作到打通数据的进出,涵盖了早期商业智能的功能。
Tableau,同FineBI同样,可分在报表层也可分为数据展示层。FineBI和Tableau同属于近年来很是棒的软件,可做为可视化数据分析软件,我经常使用FineBI从数据库中进行报表和可视化分析。相对而言,可视化Tableau更优,但FineBI又有另外一种身份——商业智能,因此在大数据处理方面的能力更胜一筹。
三、数据分析层
这个层其实有不少分析工具,固然咱们最经常使用的就是Excel ,我常常用的就是统计分析和数据挖掘工具;
Excel软件,首先版本越高越好用这是确定的;固然对Excel来说不少人只是掌握了5%Excel功能,Excel功能很是强大,甚至能够完成全部的统计分析工做!可是我也常说,有能力把Excel玩成统计工具不如专门学会统计软件;
SPSS软件:当前版本是18,名字也改为了PASW Statistics ;我从3.0开始Dos环境下编程分析,到如今版本的变迁也能够看出SPSS社会科学统计软件包的变化,从重视医学、化学等开始愈来愈重视商业分析,如今已经成为了预测分析软件;
SAS软件: SAS相对SPSS其实功能更强大,SAS是平台化的,EM挖掘模块平台整合,相对来说,SAS比较难学些,但若是掌握了SAS会更有价值,好比离散选择模型,抽样问题,正交实验设计等仍是SAS比较好用,另外, SAS的学习材料比较多,也公开,会有收获的!
JMP分析: SAS的一个分析分支
XLstat : Excel的插件,能够完成大部分SPSS统计分析功能
四、表现层
表现层也叫数据可视化,以上每种工具都几乎提供了一点展示功能。FineBI和Tableau的可视化功能上文有提过。其实,近年来Excel的可视化愈来愈棒,配上一些插件,使用感更佳。
PPT:办公经常使用,用来写数据分析报告;
Xmind&百度脑图:梳理流程,帮助思考分析,展示数据分析的层次;
Xcelsius软件:Dashboard制做和数据可视化报表工具,能够直接读取数据库,在Excel里建模,互联网展示,最大特点仍是能够在PPT中实现动态报表。
最后,须要说明的是,这样的分类并非区分软件,只是想说明软件的应用。有时候咱们把数据库就用来进行报表分析,有时候报表就是分析,有时候分析就是展示;固然有时候展示就是分析,分析也是报表,报表就是数据存储了!