《机器学习实战》KMeans均值聚类算法

一、引言 聚类是一种无监督学习,对一些没有标签的数据进行分类。 二、K均值聚类算法 2.1 算法过程: 随机确定K个初始点为质心(簇个数k由用户给定),计算数据集中每个点到每个质心的距离 本次采用的是欧式距离,然后将数据集中的每个点寻找距其最近的质心,分配到对应的簇中 完成后,每个簇的质心更新为该簇所有点的平均值。 进行迭代,直到相邻结果得到最终的质心误差在允许范围内。 2.2 对testSet.
相关文章
相关标签/搜索