cs231n笔记-批量归一化

批量归一化 Batch Normalization 期望 高斯范围内保持激活 unit gaussian activations 操作 在每个唯独独立计算经验均值和方差 归一化 合理缩放 通常在全连接层或者卷积层的后面,非线性操作的前面进行归一化操作。 问题:tanh层是否真的希望得到高斯输入? 合理放缩 引入超参数 γ \gamma γ和 β \beta β来对归一化后的x进行合理放缩 1. 改
相关文章
相关标签/搜索