Batch Normalization详解

文章目录 动机 单层视角 多层视角 什么是Batch Normalization Batch Normalization的反向传播 Batch Normalization的预测阶段 Batch Normalization的作用 几个问题 卷积层如何使用BatchNorm? 没有scale and shift过程可不可以? BN层放在ReLU前面还是后面? BN层为什么有效? 参考 博客: blog
相关文章
相关标签/搜索