由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的类似度的方法。与欧氏距离不一样的是它考虑到各类特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,由于二者是有关联的)而且是尺度无关的(scale-invariant),即独立于测量尺度。 对于一个均值为,协方差矩阵为
的多变量向量
,其马氏距离为php
马氏距离也能够定义为两个服从同一分布而且其协方差矩阵为的随机变量
与
的差别程度:ide
若是协方差矩阵为单位矩阵,马氏距离就简化为欧氏距离;若是协方差矩阵为对角阵,其也可称为正规化的欧氏距离。idea
其中是
的标准差。spa