PCA降维大纲

PCA降维主要依靠找出特征向量的前k个主成分,将特征向量由n维缩减到k维(k<<n),同时保证信息没有太大的丢失,如何选出主成分,根据常理,数据分散要比数据密集更易区分些,因此根据原始数据映射到各个主成分上时,得到的方差的大小来确定主成分的优先级。 主要途径就是通过协方差矩阵(协方差矩阵主对角线是各个特征的特征值方差,其余数值为两两特征之间的协方差,协方差表示两个数据的相关程度,为0则不相关,为1
相关文章
相关标签/搜索