引言:普通数据分析师与高级数据分析师的差别有一个很是重要的点,那就是数据思惟。数据思惟与数据敏感度有一些相似,都是相似于情商类的看不见摸不着的东西。简单来讲数据思惟是一种经过数据手段解决问题的思惟。
本文选自《从1开始——数据分析师成长之路》。面试
你们还记得中学时期或是大学时期的数学证实题吗?
已知条件A、B、C、D条件,要求证实E是成立的。
一道证实题每每只是一句话,然而解题过程每每要占据一整页篇幅。几何证实题出现的频次更是尤为高,还记得咱们在进行数学证实的时候作的证实流程吗?几乎全部的证实题都是要求经过已知条件转换为未知条件,而咱们证实的过程偏偏是方向解剖,若是要E成立须要什么条件?假设须要E、F成立;E、F成立有须要G、H、I成立;G、H、I成立刚好须要A、B、C、D条件,证实完毕。
证实流程以下。
其实这就是一种以结果为导向的思惟方法,数学带给咱们的思惟最重要的体现就是在解决问题的方式上。证实题的流程之因此如此清晰严谨可能是由于出题者已经事先梳理了证实逻辑,对于解题者来讲正确答案只有一个:证实D成立。
除了证实题,咱们还常常面对的另外一类问题是应用题。应用题大可能是把平常生活场景抽象简化,在题目中描绘一个场景,常见的题型能够归类以下:
小明在的时候发现,A事件有a属性,B事件的值是b,假设小明的C属性数据是c,问小明在D时的值d是多少?
这类题目刻画了一个事件场景,大多会交代时间、地点、人物、事件,而后给出一些参数,要求另一个参数的值。一样,咱们想要知道D的值须要两个条件E、F,想要知道E、F的值须要条件G、H、I,而G、H、I的值能够经过A、B、C的值a、b、c求得。逻辑关系梳理完成后须要经过对a、b、c三个数值进行加减乘除简单的数学计算或是积分求导等高阶数学算法,最终求得结果d。应用题和证实题的区别在于它在证实题的逻辑思惟基础之上增长了数值运算。
随着应用场景的不断复杂,咱们引入了一元一次方程、二元一次方程组、黎曼积分、极限思想等这些数学工具。这些工具发明的初衷在于解决实际生活中遇到的问题,只是实际生活中遇到的问题被抽象成了应用数学题。数学工具的不断丰富和复杂,人们再也不拘泥于现实的应用场景,开始把数学研究单独做为一门技能进行拓展和延伸。因而产生了另外一类数学题。
已知公式A,条件是B,当n趋向于正无穷,求D。
A是B的全覆盖,求证:C是D的全覆盖。
P(A|B)=K,求P(C|A)。
……
此类问题已是进阶到高等数学的范畴了,高等数学与普通数学的最大区别就在于其应用场景没那么明确具体,不像加减乘除可以让你买菜,高等数学更加抽象和理论化。它们对应的是极限的思想,全面拆分问题的思想,这时咱们再看看本章开头的两个实例:
公元前5世纪,芝诺发表了著名的阿基里斯悖论:他提出让乌龟在阿基里斯前面1000米处开始,和阿基里斯赛跑,而且假定阿基里斯的速度是乌龟的10倍。当比赛开始后,若阿基里斯跑了1000米,设所用的时间为t,此时乌龟便领先他100米;当阿基里斯跑完下一个100米时,他所用的时间为t/10,乌龟仍然前于他10米。当阿基里斯跑完下一个10米时,他所用的时间为t/100,乌龟仍然前于他1米…… 芝诺认为,阿基里斯可以继续逼近乌龟,但毫不可能追上它。
一尺之棰,日取其半,万世不竭。
这是极限思惟的实际案例,你们有没有发现问题在哪里呢?留做课后思考题吧!想清楚了天然豁然开朗,想不清楚能够去找可以帮助你想清楚的方法,寻找答案的过程也算是数据分析思惟的一部分。
咱们看到上文给出的数学问题的三个模块其实对应着数学思想的变化。
数学从提供解决问题的方法到变成数学工具,再变成数学思想。这一演变的过程为咱们提供了解决问题的思路,思考问题的方法。数据分析的思惟能够借鉴数学思想的内容,从解决实际问题的角度出发,找到须要解决这个问题的元素,一层一层地剥离下去,最终联系到咱们已有的资源。一样,咱们抛开数据分析的实际应用场景去探索数据分析方法的优化空间和可行性,对已有的数据进行聚类、分类等探索性分析,提高数据的使用效率,挖掘数据中潜在的价值,这些就是数据分析的思惟方式。
数据分析的思惟是一种解决问题的方式,以结果为导向的向数据源头的追溯。数据分析师要有一种遇到问题解决问题的自信。没有问题是没法解决的,没解决的缘由只能是投入大于产出,解决该问题带来的收益小于投入。
技能是容易掌握的,可是思惟倒是很难培养的。从咱们接触数学这门学科的那一天开始,数学就尝试向咱们传递这样一种思惟方式,所以,在面试数据分析师时我每每会问一问面试者的数学成绩怎样。数学成绩可以部分反映一我的对数学思惟的理解与运用,即便他本身均可能没有意识到这一点。这些关于数学解题的思惟方式正是数据分析师所须要的,也是数据分析师必备的。那么,如何培养数据分析的思惟呢?不妨先培养解决数学问题的思惟。常常作一些逻辑推理题或是看一些侦探小说,会有帮助的。
数据分析思惟一方面体如今它的逻辑性和方向性,另外一个重要特征是绝对客观与绝对理性。“不以物喜,不以己悲”的态度对于数据分析思惟来讲很重要,它可以帮助你摒弃主观的偏见与见解。诸如遇到突发事件能在第一时间冷静下来,抛去恐慌的情绪;对本身喜欢的项目客观分析,不对数据进行修饰;对本身犯下的错误能客观评论,给出解决方法等。喜怒哀乐是每一个人都会有的情绪,而对数据分析师而言,一旦进入工做就要绝对理性与客观,这也是数据分析师思考问题的前提。
任何人都会犯错误,咱们在平常工做中不免会犯错误,做为数据分析师,天天都和一大堆数据打交道,稍有不慎就会犯错误。如何对待本身犯下的错误是衡量一个数据分析师处理问题客观性的重要标准。人们在面临指责时的本能反应是逃避或是反击,这是人性的弱点,数据分析师可否克服这样的弱点将是他可否进阶的重要因素。当领导指责你工做没作好的时候你会以怎样的态度去面对这个问题?
攻击的态度:不是个人错,是什么什么缘由形成的。
逃避的态度:好像是错了,对不起!
客观理性的态度:是我错了,纠正方法是XXXX2小时内能够完成。这次错误的缘由是XXXX,之后不会再犯了,本月绩效相应的部分会进行扣除。
若是你是领导,你会喜欢哪一种态度呢?
领导永远是以结果为导向的,指责你犯错或是沉浸在内疚的情绪中于事无补,第一时间应该作的事情是把结果作好,而后再进行自我反省,用最客观的态度进行自我批评。这样不只给本身一个教训,也会让领导不会所以过分责怪你。你已经给出了面对此错误的最好的解决方案,别人也不会再节外生枝。更大的多是领导会由于这件事增长对你的好感度与信任度。
我想你们都读过历史类或是战争类的小说,谋士给统帅的策略通常会给出上策、中策、下策,而统帅常常会出于人道主义原则选择中策或是下策。越是厉害的谋士给出的策略出发点越是绝对理性,不考虑感性的情怀与仁慈,一切以成功为最终目的。高阶的数据分析师就要具备这种谋士的精神,客观与理性的解决问题。一样,只要统帅提出问题,谋士总能给出解决方案,虽然有些理想主义的情怀,可是能从必定意义上反映数据分析思惟的两个方面:分析问题的思想;处理问题时的态度。
思惟与态度做为数据分析思惟的两个核心要素是衡量一个数据分析师水平的软指标,培养本身的思惟与处理问题的态度须要在实践中不断完善和进步。“学而不思则罔,思而不学则殆”,数据分析的过程须要你们不断思考、不断实践,才能在这样一个过程当中不断提高本身。
本文选自《从1开始——数据分析师成长之路》,点此连接可在博文视点官网查看此书。
算法