从导数到梯度下降算法

函数的导数(derivative)描述了函数的变化率: 导数越大,表示函数增加的越快 导数越小,表示函数减少的越快 导数 = 0,对应函数的极值 对于一个误差函数(error function),我们期望找到误差函数最小的点,使得E(x)最小,那么,就要找到一个x的变化量 Δ x \Delta x Δx,使得导数最小,这样,误差函数会按照最快的减少速度逼近最小值。当x的变化方向与导数方向180°相
相关文章
相关标签/搜索