BN——Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shift

原文:https://arxiv.org/pdf/1502.03167.pdf 摘要 训练深度神经网络的复杂性在于,每层输入的分布在训练过程中会发生变化,因为前面的层的参数会发生变化。通过要求较低的学习率和仔细的参数初始化减慢了训练,并且使具有饱和非线性的模型训练起来非常困难。我们将这种现象称为内部协变量转移,并通过标准化层输入来解决这个问题。我们的方法力图使标准化成为模型架构的一部分,并为每个训
相关文章
相关标签/搜索