1。做用:降维 数据更容易分析函数
2.核心:找到一个平面(线段、体)使得全部点到这个平面的距离最短学习
3.实现方法:1)mean normalization 均值归一化 (每一个特征值的均值)or feature scaling 特征缩放3d
2)找到向量(线:一个向量,面:两个向量)orm
3)采用【u,s,v】(协方差)获得u,前k个就是投影的k个方向blog
4)乘上x 获得投影的函数z
内存
1.k的选择使得99%的差别性获得保留,由于不少数据是类似的,因此压缩后也不会形成数据的失真、
2.采用【u,s,v】,只须要使用公式一次,就能够迭代k,找到差别值》99%io
提取出输入值方法
使用PCA使得维度下降im
3.获得新的训练集
数据