相信在这个时代的当下,你们或多或少都有看到过相似“数据科学是21世纪最性感工做”的故事,以及数据科学家在这个时代显得是一份十分理想且具备超强吸金能力的工做。由于这个领域须要大量高技能人才,他们须要寻求解决复杂问题的办法(这对于“极客”来讲是一件颇有吸引力的好事)。总之,你们的描述都让这份工做在技术人的眼中显得十分梦幻、可爱。算法
但事实是,正如英国《金融时报》在这篇文章中所说,数据科学家一般“每周花1-2小时寻找新工做”。此外,文章还指出,“机器学习专家在说他们正在寻找一份新工做的开发人员中排名第一,占14.3%。数据科学家紧随其后,占13.2%,“这些数据是在他们对64000名开发者的调查中经过堆栈溢出的方法收集的。数据库
做为数据科学从业人员,我也一直有着这样的状态和想法。网络
那么为何有这么多数据科学家在寻找新的工做呢?架构
在回答这个问题以前,我应该澄清一点,我仍然是一名数据科学家。总的来讲,我很喜欢这份工做,我不想让其余人不想成为数据科学家,由于这份工做真的是有趣的、刺激的和有意义的。本文的目的是扮演一个魔鬼的倡导者并袒露这项工做的一些消极方面。机器学习
从个人角度来看,许多数据科学家对他们的工做不满意主要有如下4个缘由:oop
1.指望与现实不符学习
Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it… — Dan Ariely测试
这句话很是贴切。我所知道的许多初级数据科学家(包括我本身)都想进入数据科学领域,由于它是一种经过酷炫的机器学习算法来解决复杂问题的方法,这些算法对业务将会产生巨大的影响。这是一个让咱们以为咱们所作的工做比之前作过的任何事都重要的机会。可是,现实每每与咱们想象的相去甚远。优化
在我看来,指望与现实不符是许多数据科学家选择离开这个领域的最终缘由。网站
每一个公司都有所不一样,因此我不能表明全部的公司,但许多公司雇用数据科学家但却没有适当的基础设施来支持从AI中获取价值。这有助于AI中的冷启动问题。再加上这些公司在雇用应届生以前没有聘请资深/经验丰富的数据从业者这一事实,这也是致使双方都失望和不满的缘由之一。数据科学家多是但愿来编写智能机器学习算法来提升洞察力的,但实际工做中却没法作到这一点,由于他们的第一项工做是整理数据基础架构和/或建立分析报告。相比之下,公司只想要一张他们天天能够在董事会会议上出现的图表。
Robert Chang在他的博客文章中给出了一个对于年轻数据科学家很是有见地的建议:
重要的是要评估咱们的愿望与咱们所处环境的关键路径是否一致。寻找那些关键路径与你最为一致的项目、团队和公司。
这突出了雇主和数据科学家之间的双向关系。若是公司的位置不匹配,或者与数据科学家的目标不一致,那么数据科学家跳槽真的只是时间问题。
数据科学家们幻想破灭的另外一个缘由就是:我相信我作的事情可以对这个世界产生影响,而不只仅是在公司内部。实际上,若是公司的核心业务不是机器学习(我之前的雇主是媒体出版公司),那么你所作的数据科学极可能只能提供少许的增量收益。那种你作的事情是一个项目中很是重要、不可获取的一部分,或者你可能很幸运地遇到了一个很是棒的项目的机会的状况并不常见。
二、公司需求占主导地位
若是你认真地认为知道不少机器学习算法将使你成为最有价值的数据科学家,那么回到个人第一点:指望与现实不符。
事实上,若是但愿公司老板或业界专业人士对你有一个好印象,这可能意味着你必须常常作一些特别的工做。好比从数据库中获取数据,以便在正确的时间提供给合适的人员,作一些简单的项目。在我之前的地方,我不得不这么作。尽管这话说出来使人沮丧,但这是工做的必要部分。
三、你什么都知道
为了让老板们满意,数据科学家们不得不什么都作。由于对于老板和同事而言,他们真的对于“数据科学家”到底是作什么的,彻底没有概念。他们认为你就是作数据分析,而且把这些分析结果以报告形式呈现给老板的人。
不只仅是非技术人员对你的技能作了太多的假设。其余技术领域的同事也将会认为你知道全部与数据相关的事情。好比他们以为你应该是熟悉Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、R、Scala、Tensorflow、A/B测试、NLP等等任何你能想到的机器学习的技能的(以及任何你能想到的其余相关数据——顺便说一句,若是你看到一个包含全部这些内容的工做要求,请你清醒点!由于这意味着这份工做要求来自一家不知道本身的数据策略是什么的公司,他们会雇佣任何人,由于他们认为雇佣任何数据人员都能解决他们全部的数据问题)。
这样的臆断尚未结束!你的老板和同事们不只认为你知道全部的数据算法,同时还有你还应该能够获得全部公司内外的数据,经过……emmm,我相信做为数据工做者的你,应该5分钟前在你的邮箱中看到过相似的要求。
试图去告诉每一个人你能作的和正在作的事情实际上是很难的。这并非由于有人会真的看不起你,而是由于做为一个缺少行业经验的初级数据科学家,你会担忧你们看不起你。这其实挺矛盾的。
四、在一个独立的团队中工做
当咱们看到成功的数据产品时,咱们常常会看到专业设计的具备智能功能的用户界面,其中最重要的是,它会有一个有价值的输出,让用户感知到咱们为他解决了一个问题。而现在,若是一个数据科学家只把时间花在学习如何编写和执行机器学习算法上,那么在一个可以成功地开发出一个有价值产品的团队中,他们就只能是其中最基础和底层的部分(尽管是必要的)。
尽管如此,许多公司仍然拥有数据科学团队,他们会提出本身的项目并编写代码来尝试解决问题。在某些状况下,这就足够了。例如,若是所须要的只是一个每季度生成一次的静态电子表格,那么这些行为能够提供一些价值。另外一方面,若是目标是在定制的网站构建产品中优化提供智能建议,那么这将涉及许多不一样的技能,这是绝大多数数据科学家不该该奢望的(只有真正的数据科学独角兽才能解决这个问题)。所以,若是这个项目是由一个独立的数据科学团队承担的,那么它极可能会失败(或者须要很长时间,由于在大型企业中组织独立的团队从事协做项目并不容易)。
所以,要成为行业中拔尖的数据科学家,仅仅在Kaggle竞赛中取得好成绩并完成一些在线课程是不够的。幸运/不幸的是,(这取决于您如何看待它),它涉及到理解企业中的制度规则和一些工做环境上的软技能。在寻找一份能知足你需求的数据科学工做时,找到一家与你的职业规划路径一致的公司应该是一个关键目标。然而,你可能仍然须要从新调整对数据科学角色的指望。
原文连接:https://towardsdatascience.com/why-so-many-data-scientists-are-leaving-their-jobs-a1f0329d7ea4
以上信息来源于网络,由“京东云开发者社区”公众号编辑整理,不表明京东云立场。