为什么“梯度下降法的神经网络容易收敛到局部最优”是个错觉--笔记

  一、 我们可能从来没有找到过“局部最优”,更别说全局最优了。 作者:五楼whearer 链接:https://www.zhihu.com/question/68109802/answer/262143638 深度神经网络“容易收敛到局部最优”,很可能是一种想象,实际情况是,我们可能从来没有找到过“局部最优”,更别说全局最优了。 很多人都有一种看法,就是“局部最优是神经网络优化的主要难点”。这来
相关文章
相关标签/搜索