数据科学、机器学习和AI的区别

当我进行以数据科学家进行自我介绍时,常常会被问道:“数据科学和机器学习有什么区别?”或者“这是否是意味着你在研究人工智能?”因此我将经过本文进行回答。html

这些领域确实有不少重叠的地方,但它们并非一个领域:即便很难用语言表达,这些领域的大多数专家也都能直观的理解特定的工做是如何被分类为数据科学、机器学习或人工智能的。算法

因此在这篇文章中,我提出了关于这三个领域差别的简化定义:机器学习

·数据科学产生洞察力。工具

·机器学习作出预测。学习

·人工智能生成行为。阿里云

显然,这不是一个充分条件:不是全部符合该定义的东西都是该领域的一部分。(算命先生作出预言,但咱们不会说他们在作机器学习!)这也不是一个肯定某人角色或者职位头衔的好方法(我是数据科学家吗?)。人工智能

可是我认为这个定义对区分这三种工做是很是有效方法,而且能够避免你谈论它的时候听起来很傻。spa

数据科学生成洞察力

数据科学与其余两个领域很是不一样,由于它的目标同时也是人类的一个目标:得到洞察力和理解能力。Jeff Leek对数据科学可以达到的洞察类型有一个很好的定义,包括描述性(“平均客户端更新的概率为70%”)探索性(不一样的销售人员有不一样的更新率)和因果关系。设计

一样,并非全部产生洞察力的都有资格成为数据科学,数据科学的经典定义是它涉及了统计学,软件工程和领域专业知识的组合。可是咱们能够利用这个定义来区分它和ML、AI。它们最主要的区别在于,在数据科学循环过程当中总须要人参与:由人理解洞察结果,了解大致轮廓,或者从结论中获益。因此像“下棋算法使用数据科学来选择下一步”或者“谷歌地图使用数据科学来推荐驾驶方向”这些说法都是毫无心义的。htm

所以,数据科学的定义强调:

·统计推断

·数据可视化

·实验设计

·领域知识

·通信

数据科学家可使用一些很是简单的工具:他们能够得到百分比,并根据SQL查询结果绘制线形图。也可使用很是复杂的方法:他们可以与分散的数据仓库合做,分析数以万亿计的记录,从而开发最前沿的统计技术,创建交互式可视化。可是无论他们使用什么,目的都是为了更好地理解他们的数据。

我有几张阿里云幸运券分享给你,用券购买或者升级阿里云相应产品会有特惠惊喜哦!把想要买的产品的幸运券都领走吧!快下手,立刻就要抢光了。

机器学习作出预测

我认为机器学习属于预测领域:“给出具备特定特征的实例X,推测Y”。这些预测多是关于将来的(预测这个病人是否会进入败血症),也多是关于预测对计算机来讲不那么明显的特性(预测这个图像是否会有鸟)。几乎全部的Kaggle竞赛均可以被认为是机器学习相关的问题:他们提供一些训练数据,而后看看竞赛者可否对新的例子作出准确的预测。

数据科学和机器学习有不少的重叠之处。例如,均可以用逻辑回归来获取对有关关系的看法(越富裕的人越有可能购买咱们的产品,因此咱们应该改变咱们的营销策略)而且能够作出预测(该用户有53%的概率购买咱们的产品,因此咱们应该多向他们推销)。

相关文章
相关标签/搜索