咱们热衷于比较!python
从智能手机中的三星,苹果和HTC,移动操做系统中的iOS,Android和Windows,到即将进行选举的候选人的比较,或为世界杯团队选择队长,比较和讨论丰富了咱们的生活。若是你喜欢讨论,你须要作的就是在一个充满激情的论坛里抛出一个相关的问题,而后看着它发酵。这个过程的美妙之处就在于,论坛里的每一个人都是一个知识渊博的人。算法
那我在这里就抛出一个相似的话题—— SAS和R语言之争多是数据科学行业可能见证的最大争辩,而Python是如今发展最快的语言之一,自成立以来已经走过了漫长的道路。我开始讨论这个话题不是想看它引爆全场(虽然这也颇有趣),而是我知道咱们都会从讨论中受益。编程
这个问题也常常在博客中被人们讨论。因此,我想和你们一块儿讨论!架构
多是! 因此我仍是以为有必要进行讨论,理由以下:编程语言
好了,闲话少说,让咱们开始讨论吧!工具
下面是一些关于这三个生态系统的简要说明:oop
我将在如下属性上比较这些语言:学习
1.可用性/成本测试
2.易于学习网站
3.数据处理能力
4.图形功能
5.先进的工具
6.工做场景
7.深度学习支持
8.客户服务支持和社区
我从分析师的角度来比较这些。 所以,若是您正在为您的公司寻找要购买的工具,您可能没法在此得到完整的答案。可是如下信息仍然有用。 对于每一个属性,我给这三种语言中的每一种都给出一个分数(1 - 低 ; 5 - 高)。
这些参数的权重,根据您的职业生涯阶段和雄心而有所不一样。
SAS是一款商业软件。对于大多数专业人士而言,这是昂贵的且没有能力以我的身份购买。可是,它在私人企业中拥有最高的市场份额。 所以,除非您在投资了SAS的机构中,不然可能很难接触到SAS。 尽管如此,SAS已经引入了一个能够免费访问的大学版,但它有一些局限性。在那里你也是可使用 Jupyter notebook的!
另外一方面,R&Python是彻底免费的。如下是我对此参数的打分:
SAS - 3
R - 5
Python - 5
SAS易于学习,并为已经了解SQL的人提供简便的选项(PROC SQL)。 不只如此,它在其存储库中具备良好的稳定GUI界面。 在资源方面,各大学的网站上都有教程,SAS有全面的文档。 从SAS培训机构出来是能够得到认证的,但它们也是须要一笔花费。
R在3种语言中具备最陡峭的学习曲线。它要求您学习和理解编码。R是低级编程语言,所以简单的过程可能须要较长的代码。
Python因其编程世界的简单性而闻名。 对于数据分析也是如此。,虽然目前尚未普遍的GUI界面,但我但愿Python notebooks会变得愈来愈主流。 它们为文档和共享提供了出色的功能。
SAS - 4.5
R - 2.5
Python - 3.5
这一度是SAS的优点。 R计算内存(RAM)中的每个单元,所以计算受到32位机器上的RAM数量的限制。 可是如今已再也不是这种状况。 这三种语言都具备良好的数据处理能力和并行计算选项。我以为这再也不是一个很大的区别。 他们都带来了Hadoop和Spark集成,他们也支持Cloudera和Apache Pig。
SAS - 4
R - 4
Python - 4
SAS具备不错的功能图形功能。可是,它只是功能性的。对绘图进行任何自定义都很困难,须要您了解SAS Graph包的复杂性。R和Python具备很是先进的图形功能。 有许多软件包能够为您提供高级图形功能。随着Plotly被引入两种语言而且Python带有Seaborn,制做自定义绘图从未如此简单。
SAS - 3
R - 4.5
Python - 4.5
全部3个生态系统都具有全部基本和最须要的功能。 此功能仅在您处理最新技术和算法时才有意义。
因为其开放性,R&Python能够快速得到最新功能。 另外一方面,SAS更新了其在新版本推出中的功能。 因为R在过去被普遍用于学术界,所以新技术的发展很快。
话虽如此,SAS在受控环境中发布更新,所以它们通过了充分测试。 另外一方面,R&Python有开放的贡献,而且在最新的发展中存在错误的可能性。
SAS - 4
R - 4.5
Python - 4.5
在全球范围内,SAS仍然是用于企业工做的市场领导者。大多数大公司仍在使用SAS。另外一方面,R / Python是寻求成本效益的初创企业和公司的更好选择。此外,据报道R / Python上的工做数量在过去几年中有所增长。 这是一个在互联网上普遍发布的趋势,它显示了R和SAS工做的趋势。 用于数据分析的Python做业与R做业具备类似或更高的趋势:
下图显示了蓝色的R和橙色的SAS:
这个图表现了另外一个方面,蓝色的R与橙色的python:
总的来讲,语言的市场能够用下图表示:
SAS – 4
R – 4.5
Python – 4.5
R和Python拥有最大的在线社区,但没有客户服务支持。 因此,若是你遇到麻烦,你就是靠本身。 你会获得不少帮助。另外一方面,SAS提供专门的客户服务与社区服务。 所以,若是您在安装或任何其余技术挑战方面遇到问题,能够与他们联系。
SAS – 4
R – 3.5
Python – 3.5
SAS的深度学习仍处于起步阶段,有不少工做要作。
另外一方面,Python在该领域取得了很大的进步,并拥有许多软件包,如Tensorflow和Keras。
R最近增长了对这些软件包的支持,以及一些基础的软件包。 R中的kerasR和keras包充当了原始Python包,Keras的接口。
SAS – 2
Python – 4.5
R – 3
如下是一些值得注意的问题:
在今天的情景中,咱们看到市场略微向Python倾斜。考虑到行业的动态性,投资将会占据优点。根据您的状况(职业阶段,财务等),您能够添加本身的权重,并提出可能适合您的权重。如下是一些具体方案:
从战略上讲,须要更多实际操做帮助和培训的企业设置选择SAS做为选项。
研究人员和统计学家选择R做为替代方案,由于它有助于繁重的计算。正如他们所说,R的目的是完成工做而不是简化您的计算机。
因为其轻量级特性和不断发展的社区,Python已成为当今初创公司的明显选择。它也是深度学习的最佳选择。
这是最终的得分表: