深度残差网络ResNet

paper https://arxiv.org/pdf/1512.03385.pdf 提出动机 ResNet是为了解决深度神经网络中由于层数过多带来的模型退化问题(degradation)。 一般情况下,模型退化主要有以下几种原因: 过拟合,层数越多,参数越复杂,泛化能力弱 梯度消失/梯度爆炸,层数过多,梯度反向传播时由于链式求导连乘使得梯度过大或者过小,使得梯度出现消失/爆炸,对于这种情况,可以
相关文章
相关标签/搜索