group normalization

在BN中训练的效果会受到batch影响,大的batch效果自然好,但是小的batch求出来的均值,方差不足以表达整体样本的分布特性,所以在测试阶段误差就会很大 GN的做法则是在通道上进行划分,在划分后的通道上进行normalization https://blog.csdn.net/u013289254/article/details/99690730
相关文章
相关标签/搜索