机器学习——特征工程之主成分分析PCA

一、PCA简介 1、 定义:主成分分析是一种统计方法,通过正交变换将一组可能存在相关性的变量转换为线性不相关,转换后的这组变量称为主成分。 2、 主要应用场景:数据压缩;消除冗余;消除数据噪声;数据降维,可视化 3、 理论基础:最大投影方差理论、最小投影距离理论和坐标轴相关度理论 4、 直观理解:找出数据里最主要的成分,代替原始数据并使损失尽可能的小     a) 样本点到超平面的距离足够近  
相关文章
相关标签/搜索