机器学习笔记(12)— K均值算法

本文主要介绍K均值的运行原理、代价函数、聚类数量的选择等内容。 1.运行原理 假如有以下数据集,并且要将其分为两类。 首先使用生成两个聚类中心(图中的红蓝点)。之后该算法会计算每个样本点和两个聚类中心的距离,根据距离的远近把样本点分配给聚类中心。 第一次聚类之后的结果如下: 之后K-均值算法根据之前计算出来的距离移动聚类中心,移动之后的结果如下所示。 之后重复之前的过程,完成聚类。 通过以上例子,
相关文章
相关标签/搜索