pytorch学习笔记(十五)————动量与学习率衰减

pytorch学习笔记(十五)————动量与学习率衰减 目录 动量 学习率衰减 目录 动量 从形式上看, 动量算法引入了变量 z充当速度角色——它代表参数在参数空间移动的方向和速率。速度被设为负梯度的指数衰减平均。名称 动量(momentum),相当于引入动量前的梯度概念,指示着loss在参数空间下一步要下降的方向和大小。 其中 w k + 1 w^{k+1} wk+1表示更新后权重; w k w
相关文章
相关标签/搜索