[神经网络与深度学习]梯度不稳定问题:梯度消失与爆炸

1.初现梯度消失问题 1.1 直观上的想法与理论的证实 在《神经网络与深度学习》前面的章节中,咱们使用只含有一层隐藏层的神经网络来进行手写数字的识别,准确率高达98%。因此,凭直觉地看,咱们指望拥有更多隐藏层的神经网络可以变得更增强大: 咱们可使用中间层构建出多层的抽象,如,若是咱们在进行视觉模式识别,那么在第一层的神经元可能会学会识别边,在第二层的神经元能够在边的基础上学会识别出更加复杂的形状,
相关文章
相关标签/搜索