算法之经常使用的距离和类似度度量

在数据分析和数据挖掘的过程当中,咱们常常须要知道个体间差别的大小,进而评价个体的类似性和类别。最多见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如K最近邻(KNN)和K均值(K-Means)。固然衡量个体差别的方法有不少,这里整理罗列下。算法     为了方便下面的解释和举例,先设定咱们要比较X个体和Y个体间的差别,它们都包含了N个维的特征,即X=(x1, x2, x3, … xn),Y
相关文章
相关标签/搜索