为什么说随机最速下降法 (SGD) 是一个很好的方法?

转载:本文原作者袁洋,原文载于作者的知乎专栏——理论与机器学习,雷锋网经授权发布。 转载自:http://www.sohu.com/a/190641434_114877 本文主要介绍 SGD 算法,和两篇分析它逃离鞍点的论文: 我与鬲融,金驰,黄芙蓉写的 Escaping From Saddle Points – Online Stochastic Gradient for Tensor Deco
相关文章
相关标签/搜索