[ResNet]Deep Residual Learning for Image Recognition

ResNet一直不太能看懂,先记录一下了。 为什么需要设计ResNet degenrate(退化问题) 训练深度神经网络失败的罪魁祸首不是梯度消失,而是退化 在深度的重要性的驱使下,出现了一个新的问题:训练一个更好的网络是否和堆叠更多的层一样简单呢?解决这一问题的障碍便是困扰人们很久的梯度消失/梯度爆炸,这从一开始便阻碍了模型的收敛。归一初始化(normalized initialization)
相关文章
相关标签/搜索