聚类实践

聚类定义 聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。是无监督的分类方式。 数据的相似度度量方式 对无标识样本聚类时,必须有一种衡量样本之间相似度的方法或标准,通过这种标准来判断不同样本之间的相似性,进而来进行聚类。 1.欧式距离 p=1,dist(X,Y)=|x1-x2|+|y1-y2|,这时称为曼哈顿距离。 p=2
相关文章
相关标签/搜索