梯度消失与梯度爆炸产生原因及解决方法

1 、什么是梯度消失和梯度爆炸 在反向传播过程中需要对激活函数进行求导,如果导数大于1,那么随着网络层数的增加梯度更新将会朝着指数爆炸的方式增加这就是梯度爆炸。同样如果导数小于1,那么随着网络层数的增加梯度更新信息会朝着指数衰减的方式减少这就是梯度消失。因此,梯度消失、爆炸,其根本原因在于反向传播训练法则,属于先天不足。   2、梯度消失、爆炸导致原因 2.1、从BP(反向传播原理)解释梯度消失和
相关文章
相关标签/搜索