神经网络权重初始化

时间 2020-12-20

原文原文链接

深度学习中的weight initialization对模型收敛速度和模型质量有重要影响！在ReLU 中推荐使用Xavier Initialization的变种，暂且称之为He Initialization：使用Batch Normalization Layer可以有效降低深度网络对weight初始化的依赖：初始化为0的可行性？答案是不可行。为什么将所有W初始化为0是错误的呢？是因为如果