梯度消失和梯度爆炸

梯度消失和梯度爆炸 首先我们先说一下DNN中的梯度消失和梯度爆炸。 DNN中的梯度消失和梯度爆炸是由于激活函数引起的,主要是sigmoid函数。 因为在反向传播的过程中我们需要对激活函数进行求导,而sigmoid激活函数的导数如下图: 所以如果网络足够长的话,经过多个激活函数的导数以后就会出现梯度接近于0的情况。 梯度爆炸是由于权重参数初始化太大时,权重参数与激活函数的导数相乘导致梯度爆炸的出现。
相关文章
相关标签/搜索