Week8.2_PCA降维

主成分分析 PCA

1。做用:降维 数据更容易分析函数

2.核心:找到一个平面(线段、体)使得全部点到这个平面的距离最短学习

3.实现方法:1)mean normalization 均值归一化 (每一个特征值的均值)or feature scaling 特征缩放3d

2)找到向量(线:一个向量,面:两个向量)orm

3)采用【u,s,v】(协方差)获得u,前k个就是投影的k个方向blog

4)乘上x 获得投影的函数z
内存


1.k的选择使得99%的差别性获得保留,由于不少数据是类似的,因此压缩后也不会形成数据的失真、
2.采用【u,s,v】,只须要使用公式一次,就能够迭代k,找到差别值》99%io

PCA在有监督学习中的加速 (只在训练集中使用)

  1. 提取出输入值方法

  2. 使用PCA使得维度下降im

3.获得新的训练集

数据


PCA推荐使用的状况:

  1. 避免过拟合(正则)
  2. 只有在内存过小,太慢收敛等状况下,才使用PCA,通常都会(x(i),y(i))进行计算
相关文章
相关标签/搜索