hadoop下实现kmeans算法——一个mapreduce的实现方法

时间 2020-08-13

标签 hadoop 实现 kmeans 算法一个 mapreduce 方法栏目 Hadoop 繁體版

原文原文链接

写mapreduce程序实现kmeans算法，咱们的思路多是这样的java 1. 用一个全局变量存放上一次迭代后的质心web 2. map里，计算每一个质心与样本之间的距离，获得与样本距离最短的质心，以这个质心做为key，样本做为value，输出算法 3. reduce里，输入的key是质心，value是其余的样本，这时从新计算聚类中心，将聚类中心put到一个所有变量t中。apache 4. 在m

>>阅读原文<<