数据预处理的几个名词:中心化,归一化,去相关,白化

中心化 对数据中的每个独立值都减去一个值,使其数据各维度的中心都移到零点 归一化 将所有数据的范围都变为一个区间,使其数值范围都几乎相等。例如把所有数据都映射到-1~1之间。 去相关 把特征之间的相关性降低,数据的协方差矩阵变成对角阵,且中心为0 白化 对去相关后的数据将其方差映射到一个差不多大小的范围,如果本身数据分布是一个多变量的高斯分布,那么白化后的数据是一个均值为0,且协方差相等的矩阵。
相关文章
相关标签/搜索