数据分析 第六篇:聚类的评估(簇数肯定和轮廓系数)和可视化

在实际的聚类应用中,一般使用k-均值和k-中心化算法来进行聚类分析,这两种算法都须要输入簇数,为了保证聚类的质量,应该首先肯定最佳的簇数,并使用轮廓系数来评估聚类的结果。html 一,k-均值法肯定最佳的簇数 一般状况下,使用肘方法(elbow)以肯定聚类的最佳的簇数,肘方法之因此是有效的,是基于如下观察:增长簇数有助于下降每一个簇的簇内方差之和,给定k>0,计算簇内方差和var(k),绘制var
相关文章
相关标签/搜索