为什么说随机最速下降法(SGD)是一个很好的方法?

[本文主要介绍SGD算法,和两篇分析它逃离鞍点的论文: 我与鬲融,金驰,黄芙蓉写的Escaping From Saddle Points – Online Stochastic Gradient for Tensor Decomposition, 以及由金驰,鬲融等人写的最新力作:How to Escape Saddle Points Efficiently] 假如我们要优化一个函数 ,即找到它的
相关文章
相关标签/搜索