深入理解RNN梯度消失

1.关于理解RNN梯度消失 内容转载于:知乎-RNN梯度消失和爆炸的原因. 2.梯度消失,权值就无法更新了吗? No.梯度消失不意味着没有梯度 我们先看任意时刻 t 对权重 w x w_x wx​求导公式: 请注意红圈这是一个求和符号,即使 t 是一个很大的数,但是第公式第t 项基本不受影响,仍然是一个比较大的数值。所以即使层数深,梯度也不小,网络参数仍然能够更新。 再联想RNN参数共享机制,即使
相关文章
相关标签/搜索