数据挖掘笔记(3)——聚类、离群点分析

聚类 基本概念 聚类:       将对象分红类似的类,聚类中 一个样本可属于多个类别算法 特征:       不考虑数据的类标号,而是经过聚类产生新类标号网络 评价:         最大化类内类似性(similarity),最小化类间类似性。类似性须要定义,做为聚类的标准数据结构 数据挖掘的要求         可解释性  函数         发现任意形状的聚类大数据         处理不
相关文章
相关标签/搜索