深度学习之如何防止梯度爆炸/梯度消失?

时间 2020-12-27

原文原文链接

什么是梯度爆炸/梯度消失? 深度神经网络训练的时候，采用的是反向传播方式，该方式使用链式求导，计算每层梯度的时候会涉及一些连乘操作，因此如果网络过深。那么如果连乘的因子大部分小于1，最后乘积的结果可能趋于0，也就是梯度消失，后面的网络层的参数不发生变化. 那么如果连乘的因子大部分大于1，最后乘积可能趋于无穷，这就是梯度爆炸如何防止梯度消失？ sigmoid容易发生，更换激活函数为 ReLU即可

>>阅读原文<<

1. 深度学习-梯度爆炸和梯度消失
2. 深度学习《梯度消失和梯度爆炸》
3. 深度学习---梯度消失与梯度爆炸问题
4. 梯度消失 + 梯度爆炸
5. 梯度消失、梯度爆炸
6. 梯度消失与梯度爆炸
7. 梯度消失和梯度爆炸
8. 梯度爆炸与梯度消失
9. [nlp] 梯度消失＆梯度爆炸
10. 梯度消失/梯度爆炸
更多相关文章...
• PHP 获取图像宽度与高度 - PHP参考手册
• TCP滑动窗口机制深度剖析 - TCP/IP教程
• 算法总结-深度优先算法
• 算法总结-广度优先算法