机器学习之聚类

在无监督学习中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。此类学习任务中研究最多,应用最广的是聚类。 聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个簇。 通过这样的划分,每个簇可能对应于一些潜在的概念(类别);需说明的是,这些概念对聚类算法而言事先是未知的,聚类过程仅能自动形成簇结构,簇所对应的概念
相关文章
相关标签/搜索