hadoop下实现kmeans算法——一个mapreduce的实现方法

写mapreduce程序实现kmeans算法,咱们的思路多是这样的java 1. 用一个全局变量存放上一次迭代后的质心web 2. map里,计算每一个质心与样本之间的距离,获得与样本距离最短的质心,以这个质心做为key,样本做为value,输出算法 3. reduce里,输入的key是质心,value是其余的样本,这时从新计算聚类中心,将聚类中心put到一个所有变量t中。apache 4. 在m
相关文章
相关标签/搜索