对于机器学习,到底该选择哪一种编程语言

开发者到底应该学习哪一种编程语言才能得到机器学习或数据科学这类工做呢?这是一个很是重要的问题。咱们在许多论坛上都有讨论过。如今,我能够提供我本身的答案并解释缘由,但咱们先看一些数据。毕竟,这是机器学习者和数据科学家应该作的事情:看数据,而不是看观点。html

让咱们看一些数据。我将在Indeed.com上使用趋势搜索。它能够根据时间搜寻实际工做机会中特定的条款。这代表了雇主们正在寻找拥有该技能的人才。然而,请注意,这并非一项有效使用技能的民意调查。这种指标更能体现技能的受欢迎程度。python

话很少说,上数据。我搜索了与“机器学习”和“数据科学”一块儿使用的技能,搜索选项包括编程语言Java、C、C+++和JavaScript。而后还包括了Python和R,由于咱们知道它在机器学习和数据科学方面很受欢迎,固然还有Scala,考虑到它与Spark的关系,再加上Julia,一些开发中认为这是“the next big thing”。运行这个查询,咱们获得的数据以下:web

这里写图片描述

当咱们关注机器学习时,咱们获得了相似的数据:算法

这里写图片描述

咱们能从这些数据中获得什么启示呢?编程

首先,咱们看到并非一招通吃。在这种状况下,各类机器学习编程语言都很受欢迎。框架

其次,全部这些编程语言都在急剧增加,反映出在过去几年里,企业对机器学习和数据科学的关注和需求正在急速增长。机器学习

第三,Python很明显的领导者,其次是Java,而后是R,再而后是C++。Python对Java的领先优点正在增长,而Java在R上的领先地位正在降低。必须认可,我很惊讶地看到Java名列第二;我原本是觉得是R语言。编程语言

第四,Scala的增加使人印象深入。它在三年前几乎是不存在的,如今和这些成熟的编程语言几乎在同一个层面。当咱们切换到Indeed.com上的数据的相对视图时,这更容易发现。
这里写图片描述svg

第五,Julia的受欢迎程度虽然不明显,但确定有上升的趋势。Julia将成为一种流行机器学习和数据科学编程语言吗?将来会告诉你。性能

若是咱们忽略Scala和Julia,以便可以聚焦其余编程语言的增加,那么咱们毫无疑问能够确认:Python和R的增加速度要快于通用语言。

这里写图片描述

考虑到增加率的差别,R的受欢迎程度可能很快就会超过Java。

当咱们专一于深度学习这个问题时,数据是彻底不一样的:

这里写图片描述

这时,Python仍然是领导者,但C++如今是第二,而后是Java,而C在第四,R只在第5。这里显然强调了高性能计算语言。Java正在快速发展。它能够很快达到第二名,就像通常的机器学习同样。R不会很快接近顶部。令我惊讶的是Lua的缺席,尽管它在一个主要的深度学习框架(orch)中使用,而Julia不存在。

到这时,到底哪一种语言才是最受欢迎的编程语言呢?答案应该很清楚了。当涉及到机器学习和数据科学工做时,Python、Java和R是最流行的技能。若是你想专一于深度学习,而不是通常的机器学习,那么,在某种程度上来讲C++、C也是值得考虑的。然而,请记住,这只是看待问题的一种方式。若是你想找一份工做,或者你只是想在业余时间学习机器学习和数据科学,你可能会获得不一样的答案。

个人我的答案呢?除了有许多顶级机器学习框架的支持以外,Python对我来讲很适合,由于我有计算机科学的背景。对于开发新的算法,我也会感到很舒服,由于个人大部分职业生涯都是用这种语言编程的。但这就是我,有不一样背景的人可能会以为用另外一种语言更好。一个拥有有限编程技能的统计学家确定会更喜欢R。一个强大的Java开发人员可使用他最喜欢的语言,由于有大量的Java API的开放源代码。对于这些图表上的任何一种语言,均可以有相似的例子。

所以,个人建议是,在花大量时间学习一门语言以前,根据本身的状况来决定选择哪一种编程语言,切记千万不可跟风。

参考连接:Indeed.com