对PCA的理解

首先给出定义如下: 我们考虑n维特征存在冗余,需要降低样本维度。一个样本由n维特征表示,即由n个数字表示。就相当于在2维空间中用一个坐标(m,n)去表示一个向量,如果对很多很多样本(这些样本就是坐标)进行降维,我们会考虑将其投影到一条直线上,投影在这条直线的点就是对于这些向量新的表示,如下所示: 更抽象来说就是寻找一个新的基去表示向量,现在的问题转化为怎么寻找合适的基以达到降维的效果。由于基的个数
相关文章
相关标签/搜索