随机梯度下降算法SGD

随机梯度下降算法SGD 参考:为什么说随机最速下降法 (SGD) 是一个很好的方法? 假如我们要优化一个函数 f ( x ) f(x) f(x) ,即找到它的最小值,常用的方法叫做 Gradient Descent (GD),也就是最速下降法。说起来很简单, 就是每次沿着当前位置的导数方向走一小步,走啊走啊就能够走到一个好地方了。 如上图, 就像你下山一样,每一步你都挑最陡的路走,如果最后你没摔死
相关文章
相关标签/搜索