主成分分析——数据中心化与标准化处理

在主成分分析法中,一般来说,我们进行的第一步应该是对所有样本数据进行中心化,甚至是标准化处理。那么我们为什么要对样本数据进行中心化和标准化处理呢? 在一般的实际问题当中,我们要分析的数据一般是多个维度的,由多个特征或者属性构成的复杂数据集合。例如对某个地区的人均收入构建预测模型或者进行分析的时候,我们会考虑到该地区的GDP总量、人口数量、税收等,显然它们的单位或者说是数量级都是不一样的。我们通过中
相关文章
相关标签/搜索