Deep learning II - II Optimization algorithms - learning rate decay 学习速率衰减

时间 2020-12-20

原文原文链接

learning rate decay 学习速率衰减对于mini-batch gradient descent，其梯度下降可能会围绕最优点附近徘徊，但是由于learning rate不变，可能不会进一步靠近最优点（蓝色路径）如果learning rate会随着学习的深入不断衰减，那么上述情况会得到改善，最终的结果和更加靠近最优点（绿色路径）方法一 1 epoch=1 pass throug