基于Hadoop的Kmeans算法实现

    Kmeans算法是很典型的基于距离的聚类算法,采用距离做为类似性的评价指标。即认为两个对象的距离越近,其类似度就越大。该算法认为簇是由距离靠近的对象组成的,所以把获得紧凑且独立的簇做为最终目标。java     算法流程以下:算法     1. 从N条数据中随机选取K条数据做为初始聚类中心;数组     2. 对剩余的每条数据测量其到每一个聚类中心的距离,并将其归到最近的中心的类;app
相关文章
相关标签/搜索