神经网络损失函数公式解读

原文地址:https://www.cnblogs.com/pinard/p/6437495.htmlhtml

上面地址是一篇讲解DNN的文章,其中部分公式推导过程,本身在这里作一些记录,方便之后查阅。函数

 

上图公式由下两图公式得来,a = [ 1/ (1 + e-z) ]对z的求导,用到了sigmoid函数,sigmoid函数求导后的结果 [ e-z / (1 + e-z)],通过转换变成了(aL)(1-aL)。红色部分是巧妙点,因此softmax的交叉熵损失函数能够规避sigmoid函数导数为0的问题,解决了梯度消失问题。spa

相关文章
相关标签/搜索