深度学习之感性理解-优化器

深度学习之感性理解-优化器 梯度下降法 批量梯度下降法(BGD) 随机梯度下降法(SGD) 小批量梯度下降法(MBGD) Momentum AdaGrad Adam RMSprop 梯度下降法 批量梯度下降法(BGD) 所谓批量,就是一次性把所有样本都进行训练,因为所有的样本一起迭代算一次,所以下降方向相对比较准确,不会有太大的偏移,同时由于样本数太多,可能迭代一次会比较慢。 随机梯度下降法(SG
相关文章
相关标签/搜索