机器学习实战--聚类

一 什么是聚类? 在无监督学习中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。 聚类试图将数据集中的样本划分为活干个通常是不想交(正交)的子集,每个子集称为一个簇。通过这样的划分每个簇可能对应于一些潜在的类别。这些类别对聚类算法而言事前是未知的。聚类的过程仅能自动形成簇机构,簇所对应的类别语义需由使用者来把握和命名。 聚类既能
相关文章
相关标签/搜索