基于Hadoop的Kmeans算法实现

时间 2019-12-06

原文原文链接

Kmeans算法是很典型的基于距离的聚类算法，采用距离做为类似性的评价指标。即认为两个对象的距离越近，其类似度就越大。该算法认为簇是由距离靠近的对象组成的，所以把获得紧凑且独立的簇做为最终目标。java 算法流程以下：算法 1. 从N条数据中随机选取K条数据做为初始聚类中心；数组 2. 对剩余的每条数据测量其到每一个聚类中心的距离，并将其归到最近的中心的类；app

>>阅读原文<<