Notes on ResNet

这篇博文是博主读过何恺明及其团队的论文Deep Residual Learning for Image Recognition所做的总结,如有错误,欢迎指正! 人们主观的认为更深层的神经网络可以更好的拟合训练数据,因为深层网络会有更多的参数来学习更多的细节。但随着神经网络层数的增加,在执行反向传播的过程中很容易遇到梯度爆炸或消失的问题,从而使学习效率降低甚至不收敛。该类问题可以通过合理的初始化参数
相关文章
相关标签/搜索