Batch Normalization(批量归一化)

转载自:http://blog.csdn.net/shuzfan/article/details/50723877 原论文下载地址:https://arxiv.org/pdf/1502.03167.pdf 1-Motivation 作者认为:网络训练过程中参数不断改变导致后续每一层输入的分布也发生变化,而学习的过程又要使每一层适应输入的分布,因此我们不得不降低学习率、小心地初始化。作者将分布发生变
相关文章
相关标签/搜索