压缩算法--PCA主成分分析

参考原文 样本特征个数太多就会增加课题的复杂性,导致运算量大,计算速度慢等。当样本的某些特征之间存在相关性的时候,说明这些特征反映此课题的信息有一定的重叠,那就需要降维了,PCA就是做降维的一种算法。应用PCA目的是建立尽可能少的新特征,使得这些新特征是两两不相关的,而且这些新特征在反映课题的信息方面尽可能保持原有的信息。 PCA原理 1、协方差原理   样本X和样本Y的协方差(Covarianc
相关文章
相关标签/搜索