最近常常遇到有朋友问下面这类问题,结合最近的一些思考,本篇聊一下,数据人该具有哪些通用的技能。算法
技能分为两部分:工具和知识。工具包括Excel、Sql 和 Python,知识包括大数据、统计学和机器学习相关知识。机器学习
掌握指数:5颗星工具
掌握人群:全部数据人学习
Excel 是每一个数据人都应该掌握的一项技能,不论是研发仍是产品,Excel 应该是必备的一项基本技能。不要觉得只有搞大数据、深度学习这种才是有技术含量的工做,不少时候 Excel 能提供的功能,如今大部分大数据系统差的还远。特别是Excel的透视表和各类图,基本是数据分析必备。大数据
只是从处理的数据量上来说,通常配置的办公机,Excel 只能处理几十万行的数据。相对来说是小数据量。人工智能
掌握指数:4.5颗星设计
掌握人群:全部数据人cdn
从研发岗来说,数据开发、数据仓库、数据分析都应该具有 Sql 能力,这点不用多作解释。那么数据产品和数据运营是否应该掌握 Sql 呢?答案是确定的!对象
从使用数据的角度来说,Sql 能力意味着产品和运营可以快速本身提取本身想要的数据,而不是所有都要等研发的排期。你的核心竞争力并非 Sql ,可是 Sql 应该能帮你更有效的验证想法。居士身边大部分数据产品和数据运营都是或多或少会一些 Sql 的,至少这个比例在逐渐增长。开发
从设计数据系统的角度来说,数据产品也应该掌握 Sql,若是一点 Sql 不懂,那么如何设计自助数据分析平台?如何设计更多的数据系统?
掌握指数:4颗星
掌握人群:数据开发、数据仓库、数据分析、数据挖掘
Python,基本上是偏研发向岗位必备技能了,重要性毋庸置疑。这里只简单聊一下 Python 和 R 的选择。首先,居士支持 Python,这里无心评价哪一个语言是好的,只想说明:
至于说数据产品和运营是否须要,居士认为,简单了解就行,不是核心技能要求。
掌握指数:4.5颗星
掌握人群:全部数据人
大数据时代,全部数据人都应该具有必定的大数据知识!由于大数据相关技术已经侵入了互联网行业的方方面面,传统行业也都逐渐往大数据靠拢。
不管是研发、产品亦或者运营,都应该对大数据有一些的基本的认知,好比统计学,之前多是几万行的小数据作统计,那么当数据上亿甚至是百亿千亿以后,统计学的思路可能依旧不变,可是想要处理这些数据,就必须对大数据有所了解,要了解该怎么使用大数据的工具!
数据产品和运营亦是相似,只有了解大数据相关的一些知识,才能更好地和数据团队的各个工种站在一样的知识理解层面上对话。
注意:让产品来了解技术,并非让产品本身作技术,而是了解必定的技术后,可以更顺畅地和研发作沟通。良好的沟通有时候能决定你是否可以顺利地开展项目。
掌握指数:4颗星
掌握人群:全部数据人
统计学,玩数据的同窗都应该了解必定的统计学知识!通常来说,大部分数据分析都应该具有统计学的知识。那么问题来了?数据仓库是否也须要了解统计学?
居士是这样思考这个问题的,假设你是一名数据仓库同窗,你的一个主要服务对象可能就是数据分析,那么,你是否了解你的使用方是如何使用你的数据的?若是你都不知道使用方是如何使用你的劳动成果的,那么,你提供的数据会很好用吗?
自省一下,工做前两年,居士作的不少数据表的设计,在如今看来基本无法用!由于当时根本不知道使用方是如何用本身的表,基本处于自嗨状态。
掌握指数:4颗星
掌握人群:全部数据人
这里引用一部分 Japson 在《ML/DL科普向:从Sklearn到TensorFlow》中提到的一句话:
再结合居士的观点:统计学相关知识、人工智能相关知识已经逐渐地成为了咱们必备的基础技能。不少时候咱们要跳出本身的眼界,从更高的角度来讲,这些知识有助于咱们更好的了解本身的数据,更加了解业务,从而提升本身的竞争力,打破本身的能力边界,来进行“错位竞争”。
总体的思路就是,数据开发、数据仓库亦或者是数据产品,该不应去学习机器学习?居士想表达是,该学!为何?