Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地建立智能应用程序。经典算法包括聚类、分类、协同过滤、进化编程等等,而且,在 Mahout还支持在Hadoop集群中运行,使这些算法能够更高效的运行在云计算环境中。
目前Mahout已经发布的最高版本是0.9。在这里https://cwiki.apache.org/confluence/display/MAHOUT/BuildingMahout能够找到Mahout的下载路径,能够下载0.9版本的源码压缩包(mahout-distribution-0.9-src.tar.gz),也能够从svn中co主干代码。java
后面的介绍都是以0.9版本的源代码包为基础作的介绍。 web
前期准备:安装maven(http://my.oschina.net/MrMichael/blog/283125)。
算法
1.下载代码后,解压。apache
tar -xvf mahout-distribution-0.9-src.tar.gz
(暂时此段无用)http://seanhe.iteye.com/blog/1124682编程
而后命令行进入mahout-distribution-0.9目录执行 网络
mvn -DskipTests install
将mahout相关模块进行编译,并安装到本地maven仓库中
若是出现内存溢出,能够先调大JVM的堆内存大小 eclipse
export MAVEN_OPTS=-Xmx1024m
注意:此时可能报错。通常这个问题是因为你的网速太慢,maven没法及时获取须要的资源。解决办法就是执行下机器学习
mvn clean+mvn install
清除干净后再装。不过若是你的网络特别差就要想办法了,本人很杯具的遇到这种状况,早上7点趁你们都不用网络时,安装一次成功。maven
2.生成eclipse工程,本步骤可选,可是建议进行。由于在eclipse中修改java工程代码比较方便。仍是在mahout-distribution-0.5目录执行如下命令 svn
mvn eclipse:eclipse
2.将 movie.dat 和 ratings.dat 拷贝到 Mahout 安装目录下的 /mahout-src0.9/examples/src/main/java/org/apache/mahout/cf/taste/example/grouplens 目录下。
3.回到在 core 目录下,运行"mvn install",将 Mahout core 安装在本地库中。
TODO