著做权归做者全部。
商业转载请联系做者得到受权,非商业转载请注明出处。
做者:刘皮皮
连接:https://www.zhihu.com/question/24827633/answer/29120394
来源:知乎
类比来讲相似于
几我的站成一排
第一我的看一幅画(输入数据),描述给第二我的(隐层)……依此类推,到最后一我的(输出)的时候,画出来的画确定不能看了(偏差较大)。
反向传播就是,把画拿给最后一我的看(求取偏差),而后最后一我的就会告诉前面的人下次描述时须要注意哪里(权值修正)。
不知明白了没有,若是须要理论推导(其实就是链式法则+梯度降低法),能够参考1986年的bp算法的论文。(20141202, 补上论文题目: Learning representations by back-propagating errors, David E. Rumelhart, Geoffrey E. Hinton & Ronald J. Williams, 1986.)
http://hahack.com/reading/ann2/