使用IntelliJ IDEA 编译开源的机器学习源码--Oryx

 

What is Oryx?

大名鼎鼎的Sean Owen (http://www.linkedin.com/in/srowen) 正在 Cloudera 做为 Director of Data Science 专一投身于名为Oryx的开源机器学习项目当中。(Oryx意思是剑羚,属于非洲羚羊的一类分支)。若是您读过《Mahout in Action》这本书,您应该有印象:此书的做者之一就是Sean Owen。git

Oryx的开发意图在于帮助Hadoop用户构建机器学习模式并将其加以部署,这样咱们就可以以实时方式查询并获取其结果——例如将其做为垃圾邮件过滤器或者推荐引擎的组成部分。github

做为Hadoop当中实现机器学习模式建立的传统途径,Apache Mahout "已经走到了发展道路的尽头。"Owen如是说算法

The Oryx open source project provides simple, real-time large-scale machine learning / predictive analytics infrastructure.机器学习

Architecture

Oryx does two things at heart: builds models, and serves models. These are the responsibilities of two separate components, the Computation Layer and Serving Layer, respectively.ide

 

在 IntelliJ IDEA 中编译 Oryx 

虽然我是忠实的 Visual Studio 的拥趸(老牌的Windows Phone Developer),可是在工做中不可避免也会遇到 Java 开发的工做,好比目前专一的基于机器学习算法的推荐引擎。对我而言,Eclipse 是生命中不能承受之轻(至少目前为止是如此),以前基于 Apache Mahout 所作的推荐算法是在 Eclipse 中编码和生成Jar包,遇到的问题无数。好比在 Eclipse 中导入 无论是 Mahout 仍是 Oryx 的源码都出现我没法解决的编译错误。众所周知 Mahout 和 Oryx 都是基于 Maven 编译的,而在个人 Eclipse 开发环境中出现的 Maven 编译错误,花费了不少时间查找资料,可是最终仍是无从解决。oop

在得知机器学习领域的大神Sean Owen 使用 IntelliJ IDEA 开发 Oryx ,毅然决然地安装 IntelliJ IDEA Community Edition ( http://www.jetbrains.com/idea/download/ )。学习

在 Cloudera 的开发者社区 Data Science and Machine Learning 论坛您可发现 Owen 的足迹,耐心地为开发者解答 Apache Mahout 和 Oryx 的疑问。ui

 

在 Windows 8.1 中启动 IntelliJ IDEA,打开从 GitHub 下载的 Oryx 开源代码 (https://github.com/cloudera/oryx ) 。编码

 

 

在 Oryx Project 上点击鼠标右键,选择 "Maven" – "Reimport",IntelliJ IDEA 从新导入项目所依赖的 Maven Libraries。idea

 

至此,Oryx 的源码便可编译成功,研究之,学习之。

相关文章
相关标签/搜索