100天搞定机器学习|day38 反向传播算法推导

时间 2019-11-08

标签 100天搞定机器学习 day38 day 反向传播算法推导栏目程序员峰会繁體版

原文原文链接

往期回顾算法

100天搞定机器学习|（Day1-36）网络

100天搞定机器学习|Day37无公式理解反向传播算法之精髓机器学习

上集咱们学习了反向传播算法的原理，今天咱们深刻讲解其中的微积分理论，展现在机器学习中，怎么理解链式法则。函数

咱们从一个最简单的网络讲起，每层只有一个神经元，图上这个网络就是由三个权重和三个偏置决定的，咱们的目标是理解代价函数对这些变量有多敏感。这样咱们就知道怎么调整这些变量，才能使代价函数降低的最快。学习

咱们先来关注最后两个神经元，咱们给最后一个神经元一个上标L，表示它处在第L层。给定一个训练样本，咱们把这个最终层激活值要接近的目标叫作y，y的值为0/1。那么这个简易网络对于单个训练样本的代价就等于(a(L)−y)2。对于这个样本，咱们把这个代价值标记为C0。3d

以前讲过，最终层的激活值公式：cdn

换个标记方法：blog

整个流程就是这样的：get

固然了，a(L−1)还能够再向上推一层，不过这不重要。it

这些东西都是数字，咱们能够想象，每一个数字都对应数轴上的一个位置。咱们第一个目标是来理解代价函数对权重

的微小变化有多敏感。换句话说，求C0对

的导数。的微小变化致使产生变化，而后致使，最终影响到cost。

咱们把式子拆开，首先求的变化量比的变化量，即关于的导数；同力考虑变化量比的变化量，以及最终的c的变化量比上直接改动产生的变化量。

这就是链式法则

开始分别求导

这只是包含一个训练样本的代价对的导数，总的代价函数是全部训练样本代价的总平均，它对的导数就要求出这个表达式对每个训练样本的平均，

这只是梯度向量的一个份量，梯度由代价函数对每个权重和偏置求导数构成。

固然了，对偏置求导数也是一样的步骤。只要把替换成

一样的，这里也有反向传播的思想

到此，咱们能够方向应用链式法则，来计算代价函数对以前的权重和偏置的敏感程度

到这里，咱们能够看每层不止一个神经元的状况了，其实并不复杂太多，只是多写一些下标罢了。

这些方程式和以前每层只有一个神经元的时候本质上同样的

代价函数也相似

不一样的是代价函数对（L-1）层激活值的导数由于此时，激活值能够经过不一样的途径影响cost function，

只要计算出倒数第二层代价函数对激活值的敏感度，接下来重复上述过程就好了。至此，反向传播介绍完毕。

相关文章

相关标签/搜索

机器学习100天

机器学习算法

程序员峰会

浏览器信息

网站主机教程

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<