二分K-均值聚类

K-均值算法算法可以实现收敛,但是存在一个问题是,K-均值算法会收敛到局部最优解而不是全局最优。 一种用于度量聚类效果的指标是SSE(sum of Squared Error,误差平方和)。SSE值越小表示数据点越接近它们的质心,聚类效果也就越好。应为误差取了平方,因此更加重视那些远离中心的点。一种肯定可以降低SSE值的方法是增加簇的个数,但这违背了聚类的目标。聚类的目标是在簇数目不变的情况下提高
相关文章
相关标签/搜索