一个确定初始聚类中心的更好方法

初始聚类中心的选择对k-means算法的效果有非常显著的影响,不合适的初始聚类中心可能导致: 1,算法收敛速度降低 2,更大的可能使聚类结果收敛到一个较差的局部最小值 3,某些簇最后是个空集(样本量较小时这种情况经常出现) 经典的k-means算法的初始聚类中心是随机选取的,这种方式有两种不足: 1,某些初始聚类中心可能离群体太远,如下图 2,有的聚类中心可能相互之间隔得太近 为了克服这些缺点,比
相关文章
相关标签/搜索