Canopy算法聚类

时间 2021-01-13

原文原文链接

http://trailblizer.blog.163.com/blog/static/59630364201141973937341/ 　Canopy一般用在Kmeans之前的粗聚类。考虑到Kmeans在使用上必须要确定K的大小，而往往数据集预先不能确定K的值大小的，这样如果 K取的不合理会带来K均值的误差很大（也就是说K均值对噪声的抗干扰能力较差）。总之基于以下三种原因，选择利用Canopy聚