数据科学图鉴:你最有可能成为哪方面的专家?

全文共2774字,预计学习时长5分钟

数据宇宙正快速扩张,人们开始意识到这片领域的宽广,并且发现并非只有全才,才能谋得一袭之位。可别指望“数据通”去做所有事,现在要问的是另一个问题:“你擅长哪个方面?”

 图源:https://www.syfy.com/syfywire/the-13-greatest-x-men-of-all-time

你在哪个行业?

现实世界里,从统计学家到可靠性工程师,应用型ML/AL带来了所有和数据沾边的工作。即使有人已经学完数据“所有的”那些事儿(才怪),也没法在一天里独自做完所有活儿,时间可不够。那么,来一场数据科学生态系统的短途旅行吧,本文将用厨房作类比,向各位解释其中的常见职业。

人们可没时间独自做完所有的活。

如果将这些职业翻译成在食品产业的朋友们熟悉的行话,以下哪个最合适呢?

数据工程:提供原始材料并处理各原料。它有两种口味:(1)为数据科学家提供要使用的数据集,(2)实现大规模的数据传输。

如果只是给自己做顿晚饭,逛食品店很轻松,但是一旦扩大规模,细微的事就变得复杂——如何购买、储藏并处理20吨冰淇淋……还让它一点也不化?大规模导致了如此复杂的挑战。同样地,如果只是为学校作业下载几份电子表格,数据工程相当简单,但是当规模扩大至拍字节,可就让人头昏眼花了。

数据科学研究:开发新的厨房电器。可以把它当作数据科学的理论研究,这也是ML/AI/统计学/最优化博士要学习的内容,主要关于创造理论,让人类解决更多难题。

研究员们研发新东西。他们的职业激情将证明,以往不可能的事情有可能发生。他们一直享受工作,直到设计出产品原型,便不再追逐下个挑战。提及厨房电器,研究员就好比电器的设计图。也许他们会将设计图变成能工作的设备,但估计是由希望和胶带纸绑起来的……关上门,它就散架了。至于接口——当然,研究员的脑袋还是想着那排按钮的,但是如果有人想试着用它,最后可能会抓狂。用户友好型?稳健的?精心设计的?别想了!那是别人的工作。研究员们正忙着设法让微波炉有隐形传态的功能。(什么时候才要往工业小组里招研究员?只有需要隐形传态功能,且还没人研发出来的时候。)

数据的工具制作/平台工程:打造用户友好型电器,把它们放进令人满意的厨房。这一职业是给数据科学家提供所需的精美的工具和平台。

研究员们并不总能制造出人们真正爱用的微波炉。这时候就轮到平台工程师登场了。他们并不发明新的接线图或设计图,他们将现有的设计普及到大众消费。负责这部分的小组挤在一起,在设计思路、可靠性和效率上绞尽脑汁。他们研究用户,确保打造的工具是人们真正喜爱的。然而不幸的是,一些可怜的用户必须在忍受了“蹩脚产品”风行市场之后,才能看到喜爱的产品进入市场。在刚推出微波炉的时候,好用的简单款还没有大批量生产,因而也无法在家具商店里买到它们。AI也长期处于那段萌芽期,但现在也被认可是好用的,工具制造商正不断改善产品!这是一个激动人心的时刻,因为其实很多你认为AI很难的部分都与智能无关,而是与工具质量相关。现在工具越来越亲近用户,更多的人将进入AI领域,注入更多的创造力。

决策智能:菜谱创新和上菜。这可以算作数据科学的应用部分,内容是用数据和算法解决特定的企业问题。

决策智能小组的成员共同创新菜谱。如果他们尝试了现有算法却没法解决问题,就会招一名算法研究员,如果他们需要方便的工具,他们也会招一名平台工程师。当然,他们也乐意把其他工作外包给他人。他们对烹饪更有兴趣,但可不是所有类型的烹饪。他们是另一种研究员,通过发明一种绝妙的、高定版菜谱来解决不可能解决的企业问题。在厨房电器和原料的仓库之上还有仓库,而这些人的目标就是想出米其林级别且不含卡路里的披萨。

如果有人在应用型ML/AI领域工作,那就找出他们在项目的哪个阶段工作,再缩小范围找到他们的角色。

应用型ML/AI的项目阶段

现实项目中总是有反复和回溯,接下来是大致的几个阶段。

逐步加大:在进厨房大展身手前,要理清目标、组建队伍、配置厨房用品。如果想要微波炉,就要去商店买,如果想要传送器,就要试着发明出来。

原型:假设目标是做和正常香肠味道一样的纯素、无卡路里香肠,需要花多久呢?谁会知道!反正厨房已经备好了,祝好运吧!

生产:现在有了一份满足需求的菜谱,那就把它推向全球,生产个十年吧……

逐步加大阶段中的角色

决策者/产品经理:想给顾客提供什么产品?产品质量要多好?决策者要做决断、拟出方案。

数据工程师/建筑师:准备好卡车、建仓库,并为大规模原材料管理想出物流方法。

研究员:厨房里需要一个传送器,那就造一个。

工具制造商/平台工程师:研究员的传送器原型是用希望和胶带捣鼓出来的。造出一个人们离开后也不会散架的吧。这个目录覆盖了一个传统软件组所需的角色,从设计者到软件工程师。

举例来说,如果不想处理厨房设置或货车运输之类的事,最后三个角色可以外包给云供应商。

要对售卖的东西了如指掌:数据?算法?让他人操作AI的工具?碰巧可以使用AI的方法?建议是,随时随地专攻核心业务,让别人来操心其他事情。

原型阶段的角色

分析师:食品仓库和厨房都昏暗无比,让人不知从何处下手。分析师是唯一一个拿着手电筒的人。

数据工程师:想出运送20000吨冻胡萝卜且途中不会解冻的方法。

ML/AI工程师:一直在厨房研究菜谱,直到做出尝起来和真香肠一样的无卡路里素肠。

统计员:是否要把这道菜加进菜单?这完全取决于统计员,他们要确保新菜谱足够好并能满足需求。

生产阶段的角色

ML/AI工程师:现在有一份绝妙的菜谱模版。调整菜谱、做一些工程,从而大规模推广它。必要时,工程师们要帮助维护。

可靠性工程师:安排生产、建立安全网,哪怕缺覆盆子这样的原材料,也能让人放心地做菜谱。

分析师:监督生产过程,如果有任何不对劲就拉响警铃。

统计员:进行实地试验,尤其整备调整秘密配方时,要证实用户是否满意、菜谱是否能继续满足要求。

所有项目阶段都需要的角色

决策者/产品经理:亲爱的领导,提供一些指导吧!决策者要做出决断。

定性专家/决策科学家:如果决策者对食品一无所知,就需要定性专家在决策者和其他人间翻译沟通。

顾问/专家:决策者会咨询专家在某个特定主题上的意见,如伦理、UX等。

技术工作人员:帮助完成事情,哪怕该职位并不会明确写在名单里。没有技术工作人员可不行!传统软件项目里的所有标准角色,从开发者到项目经理、人事经理,都在ML/AI厨房里有一席之地。

留言 点赞 关注

我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)