ResNet 《Deep Residual Learning for Image Recognition》 阅读笔记

1. Introduction 首先作者说明现在很多效果很好的网络都采用了比较深的网络结构,那么想要获得性能更好的网络,是否只需要叠加层数就行了呢?作者的实验结果如下 这个问题的一个阻碍就是臭名昭著的梯度爆炸和梯度消失问题会导致无法收敛,但是这个问题通过标准化的初始化和BN这样的方法基本可以解决。 虽然可以收敛,但是还有一个问题叫degradation,就是当网络变深,准确率会先饱和然后下降。并且
相关文章
相关标签/搜索