原文 http://www.infoq.com/cn/news/2015/12/5-best-ml-api-to-use html
机器学习做为大数据的前沿无疑是让人生畏的,由于只有技术极客和数据科学领域的专家才能驾驭机器学习算法和技术,对于大部分企业和组织而言,过去这 一直都是一个高不可攀的事情。可是如今这种状况正在发生改变,正如标准的API简化了应用程序的开发同样,机器学习API也下降了这一领域的门槛,让越来 越多的人和企业可以借助技术底蕴深厚的公司所提供的API试水机器学习。python
机器学习API隐藏了建立和部署机器学习模型的复杂性,让开发者可以专一于数据挖掘和用户体验。同时,将机器学习商业化成云服务也是当今的趋 势,IBM、 Microsoft、Google、Amazon以及BigML等公司都为业务分析师和开发人员提供了本身的机器学习即服务(MLaaS),最近 Khushbu Shah 在KDnuggets上发表了一篇文章,介绍了 这5个公司的机器学习API 。算法
IBM Watson 编程
IBM Watson Developer Cloud 于2013年十一月推出,它提供了一套完整的API,简化了数据准备的流程,让开发者可以更容易地运行预测分析。做为一个认知服务,IBM Watson API容许开发人员利用机器学习技术,如天然语言处理、计算机视觉以和预测功能,来构建更加智能的产品、服务或者应用程序,经过在应用中嵌入IBM Watson,开发者还可以更好地理解用户是如何与应用程序交互的。api
IBM Watson是一个包含听、看、说以及理解等感知功能的扩展工具集,它提供的API超过了25个,涵盖了近50种技术,其中最主要的服务包括:机器学习
机器翻译——帮助翻译不一样语言组合中的文本编程语言
消息共振——找出短语或单词在预约人群中的流行度工具
问答——为主文档来源触发的查询提供直接的答案oop
用户模型——根据给定的文本预测人们的社会特征学习
Microsoft Azure机器学习 是一个用于处理海量数据并构建预测型应用程序的平台,该平台提供的功能有天然语言处理、推荐引擎、模式识别、计算机视觉以及预测建模等,为了迎合数据科学 家的喜爱,Microsoft Azure机器学习平台还增长了对Python的支持,用户可以直接将Python代码片断发布成API。借助于Microsoft Azure机器学习API,数据科学家可以更容易地构建预测模型并缩短开发周期,其主要特性包括:
支持建立自定义的、可配置的R模块,让数据分析师或者数据科学家可以使用本身的R语言代码来执行训练或预测任务
支持自定义的Python脚本,这些脚本可使用SciPy、SciKit-Learn、NumPy以及Pandas等数据科学类库
支持PB级的数据训练,支持Spark和Hadoop大数据处理平台
Google预测API 是一个云端机器学习和模式匹配工具,它可以从BigQuery和Google云存储上读取数据,可以处理销售机会分析、客户情感分析、客户流失分析、垃圾 邮件检测、文档分类、购买率预测、推荐和智能路由等用户场景。使用Google预测API的用户不须要人工智能的知识,只须要有一些基础的编程背景便可。 Google预测API支持众多的编程语言,好比 .NET、Go、Google Web Toolkit、JavaScript、Objective C、PHP、Python、Ruby和Apps Script,基本覆盖了主流的编程语言。
Amazon机器学习 API让用户不须要大量的数据专家就可以实现模型构建、数据清洗和统计分析等工做,简化了预测的实现流程。虽然该API有一些UI界面或者算法上的限制,可是倒是用户友好和向导驱动的,它为开发者提供了一些可视化工具,让相关API的使用更直观、也更清晰。
Amazon机器学习API支持的用户场景包括:
经过分析信号水平特征对歌曲进行题材分类
经过对智能设备加速传感器捕获的数据以及陀螺仪的信号进行分析识别用户的活动,是上楼、下楼、平躺、坐下仍是站立不动
经过分析用户行为预测用户是否可以成为付费用户
分析网站活动记录,发现系统中的假用户、机器人以及垃圾邮件制造者
BigML 是一个对用户友好、对开发者友好的机器学习API,该项目的动机是让预测分析对用户而言更简单也更容易理解。BigML API提供了3种重要的模式:命令行接口、Web接口和RESTful API,其支持的主要功能包括异常检测、聚类分析、决策树的SunBurst可视化以及文本分析等。
借助于BigML,用户可以经过建立一个描述性的模型来理解复杂数据中各个属性和预测属性之间的关系,可以根据过去的样本数据建立预测模型,可以在BigML平台上维护模型并在远程使用。