算法之经常使用的距离和类似度度量

时间 2019-12-11

标签算法经常使用距离类似度量繁體版

原文原文链接

在数据分析和数据挖掘的过程当中，咱们常常须要知道个体间差别的大小，进而评价个体的类似性和类别。最多见的是数据分析中的相关分析，数据挖掘中的分类和聚类算法，如K最近邻（KNN）和K均值（K-Means）。固然衡量个体差别的方法有不少，这里整理罗列下。算法　　为了方便下面的解释和举例，先设定咱们要比较X个体和Y个体间的差别，它们都包含了N个维的特征，即X=（x1， x2， x3， … xn），Y

>>阅读原文<<