批量归一化,优化与凸优化

批量归一化 1.对全连接层做批量归一化 位置:全连接层中的仿射变换和激活函数之间。 2.对卷积层做批量归⼀化 位置:卷积计算之后、应⽤激活函数之前。 3.预测时的批量归⼀化 训练:以batch为单位,对每个batch计算均值和方差。 预测:用移动平均估算整个训练数据集的样本均值和方差。 pytorch中的nn模块定义的BatchNorm1d和BatchNorm2d分别用于全连接层和卷积层。 优化与
相关文章
相关标签/搜索