神经网络损失函数公式解读

时间 2019-11-06

标签神经网络损失函数公式解读繁體版

原文原文链接

原文地址：https://www.cnblogs.com/pinard/p/6437495.htmlhtml

上面地址是一篇讲解DNN的文章，其中部分公式推导过程，本身在这里作一些记录，方便之后查阅。函数

上图公式由下两图公式得来，a^L = [ 1/ (1 + e^-z) ]对z的求导，用到了sigmoid函数，sigmoid函数求导后的结果 [ e^-z/ (1 + e^-z)²]，通过转换变成了（a^L)(1-a^L)。红色部分是巧妙点，因此softmax的交叉熵损失函数能够规避sigmoid函数导数为0的问题，解决了梯度消失问题。spa