经常使用的成分分析有PCA和FDA,本章主要介绍主成分分析PCA,对于FDA,只是简要介绍其主要数学思想。
进行成分分析的目的是对数据集特征进行降维,降维的好处有:算法
提升泛化能力:减小模型的参数数量。每每数据特征维度越高,模型越容易过拟合。函数
融入核函数的SVM,虽然是在高维特征空间下学习分类界面,可是因为SVM的VC维受分类界面与样本控制,所以不会增大其VC维,也就不会下降模型的泛化能力。学习
PCA的其它名称:离散K-L变换,Hotelling变换。优化
PCA从尽可能减小信息损失的角度实现降维。spa
PCA的优化问题: \(\min _ { \mathbf { e } _ { 1 } , \cdots , \mathbf { e } _ { d } } J \left( \mathbf { e } _ { 1 } , \cdots , \mathbf { e } _ { d } \right) = \frac { 1 } { n } \sum _ { k = 1 } ^ { n } \left\| \mathbf { x } _ { k } - \hat { \mathbf { x } } _ { k } \right\| ^ { 2 }\)blog
如图所示,坐标A降维到新的坐标系下红色虚线指向的一维坐标。(选择\(e_1\)做为新坐标系的基向量)排序
而FDA则是在可分性最大意义下的最优线性映射,充分保留了样本的类别可分性信息。数学
三类问题的FDA可视化:
class