最近,在知乎上看到一个问题:“数据分析师须要注重哪方面的计算机技能培养?”python
问题的背景是这样的:linux
某211高校通讯专业出身,毕业后在运营商工做了7年多,前后从事通讯网络运维、规划工做,近两年负责运营商数据分析(网络部门,偏向业务分析)。算法
因为职业发展瓶颈,从去年11月计划跳槽,花了半年时间学习统计学基础、SQL、Python等。shell
近期跳槽到互联网产品部门,从事互联网产品(APP)的数据分析师,支撑产品部门的数据分析(偏向业务分析,不负责数据仓库、ETL等偏向IT工做)。工做内容差别较大,包括分析的颗粒度、工做方式(例如本身写shell脚本跑数)、工做内容,所以紧急提高linux(shell编程)、SQL等技能,且加快对业务的熟悉,但仍感受亚历山大。数据库
我的想继续往数据分析方向发展,也深知数据分析包括计算机科学、统计学、业务等三个部份内容,目前比较欠缺的应该是计算机科学,请问对于想往数据分析师(数据科学)方向发展,计算机科学方面的技能可否给些提高建议?编程
今天也是想借这个问题,系统回答下“数据分析师”的职业发展,也是最近在思考的。网络
根据我近10年的工做经验,包括在甲方IT部任职BI项目经理和运营部任职业务分析经理,乙方Data Analytics项目(EDW/BI/Big Data/AI Machine Learning)咨询和项目实施经验,按照由易到难的进阶步骤,我以为应该掌握这些技能:运维
基础篇
一、首先是Excel,貌似这个很简单,其实未必。Excel不只可以作简单二维表、复杂嵌套表,能画折线图/Column chart/Bar chart/Area chart/饼图/雷达图/Combo char/散点图/Win Loss图等,并且能实现更高级的功能,包括透视表(相似于BI的多维分析模型Cube),以及Vlookup等复杂函数,处理100万条之内的数据没有大问题。最后,不少更高级的工具都有Excel插件,例如一些AI Machine Learning的开发工具。机器学习
二、掌握SQL Server或者Oracle的SQL语句,虽然你是业务分析师,但若是取数据能少依赖于IT人员和IT工具(好比BI的多维分析模型,有时候并不能获取你想要的数据),对于作业务分析,无疑是如虎添翼,我曾经见过华为的会计能写七层嵌套的SQL语句,很吃惊。包括join, group by, order by, distinct, sum, count, average, 各类统计函数等。数据库设计
三、掌握可视化工具,好比BI,如Cognos/Tableau/FineBI等,具体看企业用什么工具,像我以前用的是FineBI。这些工具作可视化很是方便,特别是分析报告能含这些图,必定会吸引高层领导的眼球,一目了然了解,洞察业务的本质。另外,做为专业的分析师,用多维分析模型Cube可以方便地自定义报表,效率大大提高。
总结:至此,掌握以上技能的80%,能够算是一个合格的分析师了。这个阶段的数据分析师,须要既懂得如何利用工具处理数据,也要懂得业务场景,能分析解决基本的问题。这里仍是要强调一点,数据分析师最重要的是熟悉业务,最好是懂。懂业务,分析逻辑就会清晰通常,并且也能排除大部分无用的尝试。长期以往对于了解的业务,比对一下数据就知道问题出在哪里了。
以后,若是是要深钻技术,甚至往数据科学家方向上发展。
进阶篇
一、系统的学好统计学
纯粹的机器学习讲究算法预测能力和实现,可是统计一直就强调“可解释性”。好比说,针对今天微博股票发行就上升20%,你把你的两个预测股票上涨仍是下跌的model套在新浪的例子上,而后给你的上司看。统计学就是这样的做用。
数据挖掘相关的统计方法(多元Logistic回归分析、非线性回归分析、判别分析等)
定量方法(时间轴分析、几率模型、优化)
决策分析(多目的决策分析、决策树、影响图、敏感性分析)
树立竞争优点的分析(经过项目和成功案例学习基本的分析理念)
数据库入门(数据模型、数据库设计)
预测分析(时间轴分析、主成分分析、非参数回归、统计流程控制)
数据管理(ETL(Extract、Transform、Load)、数据治理、管理责任、元数据)
优化与启发(整数计划法、非线性计划法、局部探索法、超启发(模拟退火、遗传算法))
大数据分析(非结构化数据概念的学习、MapReduce技术、大数据分析方法)
数据挖掘(聚类(k-means法、分割法)、关联性规则、因子分析、存活时间分析)
其余,如下任选两门(社交网络、文本分析、Web分析、财务分析、服务业中的分析、能源、健康医疗、供应链管理、综合营销沟通中的几率模型)
风险分析与运营分析的计算机模拟
软件层面的分析学(组织层面的分析课题、IT与业务用户、变革管理、数据课题、结果的展示与传达方法)
二、掌握AI Machine Learning算法,会用工具(好比Python/R)进行建模。
传统的BI分析能回答过去发生了什么?如今正在发生什么?但对于将来会发生什么?必须靠算法。虽然像Tableau、FineBI等自助式BI已经内置了一部分分析模型,可是分析师想要更全面更深度的探索,须要像Python/R的数据挖掘工具。另外大数据之间隐藏的关系,靠传统工具人工分析是不可能作到的,这时候交由算法去实现,无疑会有更多的惊喜。
其中,面向统计分析的开源编程语言及其运行环境“R”备受瞩目。R的强项不只在于其包含了丰富的统计分析库,并且具有将结果进行可视化的高品质图表生成功能,并能够经过简单的命令来运行。此外,它还具有称为CRAN(The Comprehensive R Archive Network)的包扩展机制,经过导入扩展包就可使用标准状态下所不支持的函数和数据集。R语言虽然功能强大,可是学习曲线较为陡峭,我的建议从python入手,拥有丰富的statistical libraries,NumPy ,SciPy.org ,Python Data Analysis Library,matplotlib: python plotting。
最后,怎么说呢,不管什么时候业务分析、数据分析仍是数据科学教,他的价值体现仍是在于商业价值。数据人才到最后的发展也必定是要往企业运营VP、战略参谋者身居。好比,数据战略家可使用IT知识和经验来制定商业决策,数据科学家能够结合对专业知识的深刻理解使用IT技术开发复杂的模型和算法,分析顾问能够结合实际的业务知识与分析经验聚焦下一个行业爆点。
因此须要你具有沟通、组织、管理能力和商业思惟,这就不仅局限于某个岗位了,须要你站在更高位的角度思考,为企业谋福利。同时也要思考,拿着“数据分析”这张牌,如何在公司发挥价值,用数据驱动企业运营,这是要思考的。
课程推荐
若是想快速对数据分析创建认知,找到一个学习方向,推荐秦路老师的《7周入门数据分析》。
若是是在想要从事或已经从事数据工做的,好比“表哥表姐”,须要相似一个大牛在帮扶着教你的,这里重点安利一个叫《决策菁英》的培训课程。
这个课程算是我见过比较齐全比较接地气的了。从行业背景、我的定位、工具技术学习、业务需求配合、职业发展,在企业放大数据分析的影响力等等,都有很详细的解答。
尤为是成为数据分析师以后,可能会面临的一些问题:好比说你基于数据分析得出结论和建议,领导不采纳不接受,决策难落地,本身也作不出成果。若是你发展的顺利,公司组建了一个数据中心,你做为leader,为了迎合如今以及将来各类各样的业务需求,可能须要设计开发数据产品,很大一部分工做就涉及与业务、技术如何配(si)合(bi)沟通的事。
最后,成为数据部门的老大,可能须要考虑如何将我的的影响力、部门的影响力在企业中放大。这里数据分析可能要在全公司推广,数据分析的决策可能也要上升到影响战略的程度,这其中也有不少技能以外的东西。
转自: https://504479728.iteye.com/b...