k-均值聚类
n 个样本分到 k 个不一样的类或簇,每一个样本到其所属类的中心的距离最小。git
每一个样本只能属于一个类,全部 k-均值聚类 是 硬聚类。github
模型
- k < n

策略
- 距离: 欧式距离
- 损失函数:样本与所属类的中心的距离总保
- NP 困难问题
算法
目标函数极小化算法
- 初始化,随机取
个样本作中心
- 对样本进行聚类,计算样本到类中心距离,每一个样本指派到与其最近的中心的类
- 计算新的类中心。对聚类结果计算样本的均值,作为新的类中心
- 若是迭代收敛或符合中止条件,输出。不然,令
,返回 2
源码:github.com/iOSDevLog/s…函数