李沐第十三课--时间反向传播

反向传播是计算深度学习模型参数梯度的方法。总的来说,反向传播中会依据微积分中的链式法则,按照输出层、靠近输出层的隐含层、最近输入层的隐含层和输入层的次序,依次计算并存储模型损失函数有关模型各层的中间变量和参数的梯度 反向传播对于各层中变量和梯度的计算可能会依赖各层变量和参数的当前值 正向传播:对深度学习模型按照输入层、最近输入层的隐含层、靠近输出层的隐含层和输出层的次序,依次计算并存储模型的中间变
相关文章
相关标签/搜索