前几天和一朋友A聊天,一个在我看来彻底能够在大部分行业领域公司独当一面的数据分析师,目前仍谦虚的以“数据猿”自称。从事数据分析的他,半路出家,起初虽然懂一些数据库的知识,但仍然和不少人同样,艰难地上了路。因而咱们就索性一块儿讨讨经,“一本正经”地聊起工做来,留下点感悟。数据库
说入门很简单必定是骗你的,A说本身是从记数据开始的,记数据一方面是为了应付领导的提问,另外一方面也是在培养数据的敏感度。确实,分析的源头通常是某些指标有了明显的变更,熟悉天天的交易数据或用户数据能让你一眼就看出问题在哪里,哪些数据有关联,而后再作分析。而我是从Excel作起的,大部分时间都是在取数,作“表哥”,还要抵挡来自业务的需求***。后来,他去作了数据挖掘,我从BI再从数据平台转作了技术。安全
万事开头难,但一旦数据分析有了动力,就要开始完善本身的知识体系,这也是真正入门的开端。那如何完善数据分析的知识体系?网络
一、基本的计算机知识和统计知识框架
数据库+SQL语言ide
一些经常使用的数据库如Oracle、SQL Sever、DB二、MySQL,这些数据库或者说平常接触的数据库都要有所了解,懂最经常使用的就好,最重要的仍是要会写SQL。函数
数学/统计学知识工具
一些基本的数学统计方法如描述性统计、多元统计分析、回归分析等,重要性不言而喻。学习
数据挖掘知识:方差分析、回归分析、因子分析、聚类分析等等。这些东西做为入门多多少少都要会一些,虽然有可能不会全用到,但一旦用时方恨少。测试
数据分析可视工具大数据
数据分析可视化工具很宽泛。首推Excel,中小公司很依赖,熟练使用数据透视表,这是必备技能。中大型公司都是用报表工具或者BI来作报表,但有了SQL+Excel的基础,这些工具上手都很快。
二、业务知识
数据分析师要与公司的各业务打交道,因此对于各部门的业务知识要有深刻的了解。某业务领导须要知道某个指标,你须要知道这个指标由哪些数据构成?数据统计的口径是什么?数据怎么取出来?这个指标对于行业的意义是什么,处于什么范围分别对应什么样的状况,是好仍是坏。而后慢慢摸索这个指标层面多维度的规律,如何设定最合理。
附上网上的一张数据分析师能力体系图,用于参考。
数据分析是一贯比较专业的工做,要时刻警戒本身能力是否有提高,目前是什么样的水平,习惯反思本身:
这里引用知乎上@任明远的回答
一、你了解你所整理的数据的来源吗?是本身公司的业务数据,仍是与合做伙伴交换的数据?是本身公司相关部门采集的,仍是从第三方获取的?获取过程当中,具体的指标和逻辑是什么?
二、这些数据是真实的吗?采集和整理过程当中会不会出现什么问题?技术上的逻辑和业务上的逻辑是不一样的概念,有没有技术上没有瑕疵,但并不符合业务逻辑的数据流程?
三、到你手里的数据通过了什么处理?你又作了什么处理?为何他们和你要作这些处理?
四、谁须要你的数据?你处理后的数据流向哪里?他们用数据作什么?这些数据最终又拿去作了什么?好比,为客户作了什么服务,公司发布了什么内容,或向管理层证实了什么KPI,或支持了哪一个部门的评估?
五、你作整理的周期是什么?为何是这样的周期?
六、公司有其余的部门在处理其余的数据吗?是什么样的数据?和你有什么关系?为何这些数据要分开处理?
七、近一年,你本身的电脑上应该已经积累了很多数据,试试作个分析,从一段较长的时间来看,你负责的这一块数据发生了什么变化?为何会有这个变化?和公司的产品、经营、业务有关,仍是和行业有关?具体怎么有关?
业务上
1.业务为核心,数据为王
了解整个产业链的结构
制定好业务的发展规划
了解衡量的核心指标
有了数据必须和业务结合才有效果
须要懂业务的总体概况,摸清楚所在产业链的整个结构,对行业的上游和下游的经营状况有大体的了解。而后根据业务当前的须要,指定发展计划,从而归类出须要整理的数据。最后一步详细的列出数据核心指标(KPI),而且对几个核心指标进行更细致的拆解,固然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。前期资料的收集以及业务现况的全面掌握很是关键。
2.思考指标现状,发现多维规律
熟悉产品框架,全面定义每一个指标的运营现状对
比同行业指标,挖掘隐藏的提高空间
拆解关键指标,合理设置运营方法来观察效果
争对核心用户,单独进行产品用研与需求挖掘
业务的分析大可能是定性的,须要培养一种客观的感受意识。定性的分析则须要借助技术、工具、机器。而感受的培养,因为每一个人的思惟、感知都不一样,只能把控大致的方向,不少数据元素之间的关系仍是须要经过数据可视化技术来实现。
3.规律验证,经验总结
发现了规律以后不能马上上线,须要在测试机上对模型进行验证。
技能上
1.Excel是否精钻?
除了经常使用的Excel函数(sum、average、if、countifs、sumifs、offset、match、index等)以外,Excel图表(饼图、线图、柱形图、雷达图等)和简单分析技能也是常常用的,能够帮助你快速分析业务走势和异常状况;另外,Excel里面的函数结合透视表以及VBA功能是完善报表开发的利器,让你一键轻松搞定报表。
2.你须要更懂数据库
经常使用的数据库如MySQL,Sql Server、Oracle、DB二、MongoDB等;除去SQL语句的熟练使用,对于数据库的存储读取过程也要熟练掌握。在对于大数据量处理时,如何想办法加快程序的运行速度、减小网络流量、提升数据库的安全性是很是有必要的。
3.掌握数据整理、可视化和报表制做
数据整理,是将原始数据转换成方便实用的格式,Excel在协同工做上并非一个好工具,报表FineReport比较推荐。项目部署的Tableau、FineBI、Qlikview一类BI工具,有没有好好培训学习,这些便捷的工具都能淡化数据分析时一些重复性操做,把精力更多留于分析。