Deep learning II - II Optimization algorithms - RMSprop (Root Mean Square prop)均方根传递

RMSprop 相较于gradient descent with momentum,RMSprop的思想是,对于梯度震动较大的项,在下降时,减小其下降速度;对于震动幅度小的项,在下降时,加速其下降速度。 通过使用指数加权平均计算得到 Sdw, Sdb S d w ,   S d b ;使用他们来更新参数(如下图所示) Sdw=βSdw+(1−β)dw2 S d w = β S d w + ( 1
相关文章
相关标签/搜索