keras各种优化方法总结 SGDmomentumnesterov

  http://blog.csdn.net/luo123n/article/details/48239963   前言 这里讨论的优化问题指的是,给定目标函数f(x),我们需要找到一组参数x,使得f(x)的值最小。 本文以下内容假设读者已经了解机器学习基本知识,和梯度下降的原理。 SGD SGD指stochastic gradient descent,即随机梯度下降。是梯度下降的batch版本。
相关文章
相关标签/搜索