《动手学深度学习》第二十二天---残差网络(ResNet)

(一)ResNet提出背景 更深的网络能够进行更加复杂的特征模式的提取,从而理论上更深的网络能够获得更好的结果。web 可是经过简单的叠加层的方式来增长网络深度,可能引来梯度消失/梯度爆炸的问题,目前**batch normalization等方法能够解决梯度消失和梯度爆炸的问题。**可是使用了各类normalization的方法也不能是深层网络的效果好于浅层网络。 理论上,若A为浅层网络,B为深
相关文章
相关标签/搜索