【CS231n】Lecture 6:Training Neural Networks,Part 2

CS231n系列课程笔记:作为本人的笔记记录,并无商用用途 CS231n:http://cs231n.stanford.edu/ 参数更新(Parameter Update) 本文参数更新主要针对神经网络中反向传播过程中weights和biases的更新方式做的笔记。 SGD 缺点:水平方向平缓,垂直方向陡峭时,SGD容易发生抖动,找到最优解的时间最长 参数更新公式: Momentum 解释:梯度
相关文章
相关标签/搜索