机器学习算法系列(5):聚类的概念与模型

一.聚类的简介 (一)引言 聚类属于无监督学习,对大量未标注的数据集,按照数据内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。 给定一个有N个对象的数据集,构造数据的K个簇,K≤N,同时满足,每个簇至少包含一个对象,每一个对象属于且仅属于一个簇,将满足上述条件的K个簇称作一个合理划分。它的主要思想是对于给定的类别数目K,首先给出初始划分,通过迭代改变样本和簇的隶
相关文章
相关标签/搜索