聚类总结:各种聚类算法的分类、优缺点、适用场景总结

一.聚类的概念 1.定义 聚类指的是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离。 (注:聚类方法是属于无监督的分类方式。) 2.聚类的分类 聚类方法主要划分为五大类: (1)基于层次的聚类 原理:试图在不同层次上对数据集进行划分,从而
相关文章
相关标签/搜索