Principle component analysis (PCA) (主成分分析)

1.以一个二维数据为例说明PCA的目标 如上图所示,我们要在二维空间中找到一个维度(一个vector),将原数据集上的数据映射到这个vector上进行降维。如果没有施加限制,那么我们有无穷多种映射方法。 但是,我们知道,为了使数据集含有更多的信息,我们应该尽可能将降维后的数据区分开。以上图为例,如果选择Small variance的那条向量,很多数据点映射后挤在一起,那么我们就会损失许多有用信息。
相关文章
相关标签/搜索