激活函数选取不当为什会形成梯度消失

下图为四层神经网络,它包括输入层,输出层,两个隐层 假设输入层到第一个隐层的权值为,偏置值为。两个隐层之间的权值为,偏置值为。第二个隐层到输出层的权值为,偏置值为。如今假设输入的值为,输出为,标签值为。前一层的输出为后一层的输入则输出层输出为:网络 (f为激活函数) 函数 代价函数咱们使用经常使用的方差函数:blog 咱们知道利用梯度降低法更新权值的公式为:神经网络 如今咱们想更新的权值,根据权值
相关文章
相关标签/搜索