inception v2

深度网络为什么难训练?   因为internal covariate shift internal covariate shift:在训练过程中,每层的输入分布因为前层的参数变化而不断变化 从不同的角度说明问题internal covariate shift   1.SGD训练多层网络           总损失是,当,损失转换为            梯度更新是            当x的分布
相关文章
相关标签/搜索