深度学习方法(二十一):常用权重初始化方法Xavier,He initialization的推导

文章目录 交叉熵目标函数更陡峭 Xavier initialization [1][4] He initialization [2][3] He init 考虑ReLU函数 He init 考虑Leaky ReLU函数 结束语 参考资料 交叉熵目标函数更陡峭 在论文[1]中给了一个图示,一定程度上说明了为什么Cross Entropy用的很多,效果很好。图中上面的曲面表示的是交叉熵代价函数,下面的
相关文章
相关标签/搜索