Gradient Descent

之前我们介绍过梯度下降算法,以下我们进行算法的优化,由于特征值数字大小范围不一,可能会造成算法逼近的时候出现奇怪的轨迹,如图x~1 为0~ 2000,x~2 为1~ 5,就会造成代价函数图中的椭圆又扁又长。 因此我们用一些小技巧优化特征值使-1<x<1或者-0.5<x<0.5 ,称作特征值的归一化。 便是用此公式计算新的值代替,其中μi为xi在样本中的平均值,si为xi的范围(即最大值减去最小值)
相关文章
相关标签/搜索