LR为什么要进行归一化

1 归一化为什么能提高梯度下降法求解最优解的速度?       斯坦福机器学习视频做了很好的解释:https://class.coursera.org/ml-003/lecture/21       如下图所示,蓝色的圈圈图代表的是两个特征的等高线。其中左图两个特征X1和X2的区间相差非常大,X1区间是[0,2000],X2区间是[1,5],其所形成的等高线非常尖。当使用梯度下降法寻求最优解时,很
相关文章
相关标签/搜索