马氏距离(Mahalanobis Distance)是一种用于度量数据点之间距离的方法,由印度统计学家P. C. Mahalanobis提出。它考虑了数据特征间的相关性,并且是尺度无关的,即不依赖于测量尺度。马氏距离的计算公式如下:
\[ d_M(x, y) = \sqrt{(x - \mu)^T \Sigma^{-1} (x - \mu)} \]
其中:
\( x \) 和 \( y \) 是从均值为 \( \mu \) ,协方差矩阵为 \( \Sigma \) 的总体中随机抽取的两个样本。
\( \Sigma^{-1} \) 是协方差矩阵 \( \Sigma \) 的逆矩阵。
马氏距离的一个重要特性是,当协方差矩阵 \( \Sigma \) 是单位矩阵时,它简化为欧氏距离;当 \( \Sigma \) 是对角阵时,它也可以称为正规化的欧氏距离。
马氏距离在机器学习和数据挖掘中广泛应用,因为它能够处理高维数据,并且可以应对数据中各维度间非独立同分布的问题。