Deep learning II - II Optimization algorithms - RMSprop (Root Mean Square prop)均方根传递

时间 2020-12-20

原文原文链接

RMSprop 相较于gradient descent with momentum，RMSprop的思想是，对于梯度震动较大的项，在下降时，减小其下降速度；对于震动幅度小的项，在下降时，加速其下降速度。通过使用指数加权平均计算得到 Sdw, Sdb S d w , S d b ；使用他们来更新参数（如下图所示） Sdw=βSdw+(1−β)dw2 S d w = β S d w + ( 1