[ch02-02] 非线性反向传播

时间 2019-11-26

原文原文链接

系列博客，原文在笔者所维护的github上：https://aka.ms/beginnerAI，
点击star加星不要吝啬，星越多笔者越努力。git

2.2 非线性反向传播

2.2.1 提出问题

在上面的线性例子中，咱们能够发现，偏差一次性地传递给了初始值w和b，即，只通过一步，直接修改w和b的值，就能作到偏差校订。由于从它的计算图看，不管中间计算过程有多么复杂，它都是线性的，因此能够一次传到底。缺点是这种线性的组合最多只能解决线性问题，不能解决更复杂的问题。这个咱们在神经网络基本原理中已经阐述过了，须要有激活函数链接两个线性单元。github

下面咱们看一个非线性的例子，如图2-8所示。网络

图2-8 非线性的反向传播函数

其中\(1<x<=10，0<y<2.15\)。假设有5我的分别表明x、a、b、c、y：spa

正向过程

第1我的，输入层，随机输入第一个x值，x取值范围(1,10]，假设第一个数是2
第2我的，第一层网络计算，接收第1我的传入x的值，计算：\(a=x^2\)
第3我的，第二层网络计算，接收第2我的传入a的值，计算b：\(b=\ln (a)\)
第4我的，第三层网络计算，接收第3我的传入b的值，计算c：\(c=\sqrt{b}\)
第5我的，输出层，接收第4我的传入c的值

反向过程

第5我的，计算y与c的差值：\(\Delta c = c - y\)，传回给第4我的
第4我的，接收第5我的传回\(\Delta c，计算\Delta b：\Delta b = \Delta c \cdot 2\sqrt{b}\)
第3我的，接收第4我的传回\(\Delta b，计算\Delta a：\Delta a = \Delta b \cdot a\)
第2我的，接收第3我的传回\(\Delta a，计算\Delta x：\Delta x = \Delta a / 2x\)
第1我的，接收第2我的传回\(\Delta x，更新x：x = x - \Delta x\)，回到第1步

提出问题：假设咱们想最后获得c=2.13的值，x应该是多少？（偏差小于0.001便可）code

2.2.2 数学解析解

\[c=\sqrt{b}=\sqrt{\ln(a)}=\sqrt{\ln(x^2)}=2.13\]
\[x = 9.6653\]blog

2.2.3 梯度迭代解

\[ \frac{da}{dx}=\frac{d(x^2)}{dx}=2x=\frac{\Delta a}{\Delta x} \tag{1} \]
\[ \frac{db}{da} =\frac{d(\ln{a})}{da} =\frac{1}{a} = \frac{\Delta b}{\Delta a} \tag{2} \]
\[ \frac{dc}{db}=\frac{d(\sqrt{b})}{db}=\frac{1}{2\sqrt{b}}=\frac{\Delta c}{\Delta b} \tag{3} \]
所以获得以下一组公式，能够把最后一层\(\Delta c\)的偏差一直反向传播给最前面的\(\Delta x\)，从而更新x值：
\[ \Delta c = c - y \tag{4} \]
\[ \Delta b = \Delta c \cdot 2\sqrt{b} \tag{根据式3} \]
\[ \Delta a = \Delta b \cdot a \tag{根据式2} \]
\[ \Delta x = \Delta a / 2x \tag{根据式1} \]get

咱们给定初始值\(x=2，\Delta x=0\)，依次计算结果如表2-2。input

表2-2 正向与反向的迭代计算博客

方向	公式	迭代1	迭代2	迭代3	迭代4	迭代5
正向	\(x=x-\Delta x\)	2	4.243	7.344	9.295	9.665
正向	\(a=x^2\)	4	18.005	53.934	86.404	93.233
正向	\(b=\ln(a)\)	1.386	2.891	3.988	4.459	4.535
正向	\(c=\sqrt{b}\)	1.177	1.700	1.997	2.112	2.129
	标签值y	2.13	2.13	2.13	2.13	2.13
反向	\(\Delta c = c - y\)	-0.953	-0.430	-0.133	-0.018
反向	\(\Delta b = \Delta c \cdot 2\sqrt{b}\)	-2.243	-1.462	-0.531	-0.078
反向	\(\Delta a = \Delta b \cdot a\)	-8.973	-26.317	-28.662	-6.698
反向	\(\Delta x = \Delta a / 2x\)	-2.243	-3.101	-1.951	-0.360

表2-2，先看“迭代-1”列，从上到下是一个完整的正向+反向的过程，最后一行是-2.243，回到“迭代-2”列的第一行，2-(-2.243)=4.243，而后继续向下。到第5轮时，正向计算获得的c=2.129，很是接近2.13了，迭代结束。

运行示例代码的话，能够获得以下结果：

how to play: 1) input x, 2) calculate c, 3) input target number but not faraway from c
input x as initial number(1.2,10), you can try 1.3:
2
c=1.177410
input y as target number(0.5,2), you can try 1.8:
2.13
forward...
x=2.000000,a=4.000000,b=1.386294,c=1.177410
backward...
delta_c=-0.952590, delta_b=-2.243178, delta_a=-8.972712, delta_x=-2.243178
......
forward...
x=9.655706,a=93.232666,b=4.535098,c=2.129577
backward...
done!

为节省篇幅只列出了第一步和最后一步（第5步）的结果，第一步时c=1.177410，最后一步时c=2.129577，中止迭代。

代码位置

ch02, Level2