机器学习(九)聚类K-means

什么是聚类 聚类就是对大量未知标注的数据集,按照数据内部存在的数据特征将数据集划分为多个不同的类别,使类别内的数据比较相似,类别之间的数据相似度比较小; 属于无监督学习  聚类算法的重点是计算样本项之间的相似度,有时候也称为样本间的距离  和分类算法的区别: 分类算法是有监督学习,基于有标注的历史数据进行算法模型构建 聚类算法是无监督学习,数据集中的数据是没有标注的 相似度/距离公式 pearso
相关文章
相关标签/搜索