常见的深度学习参数初始化方法总结

目录 1 随机初始化 2 Xavier初始化 3 He初始化 4 高斯随机初始化 with Batch Norm 5 Pre-train Reference 1 随机初始化   2 Xavier初始化 每层的权重初始化公式如下: 上式为一个均匀分布,n_j为输入层的参数,n_(j+1)为输出层的参数 Xavier的推导过程是基于几个假设的, 其中一个是激活函数是线性的,这并不适用于ReLU,sig
相关文章
相关标签/搜索