cs231_n6.2_批量归一化

想要保持单位高斯激活,那么就需要做批量归一化,即在神经网络中额外加入一层,以使得中间的激活值均值为0方差为1。 BN,LN,IN,GN从学术化上解释差异: BatchNorm:batch方向做归一化,算NHW的均值,对小batchsize效果不好;BN主要缺点是对batchsize的大小比较敏感,由于每次计算均值和方差是在一个batch上,所以如果batchsize太小,则计算的均值、方差不足以代
相关文章
相关标签/搜索