为什么说随机最速下降法 (SGD) 是一个很好的方法？

时间 2020-12-20

原文原文链接

转载：本文原作者袁洋，原文载于作者的知乎专栏——理论与机器学习，雷锋网经授权发布。转载自：http://www.sohu.com/a/190641434_114877 本文主要介绍 SGD 算法，和两篇分析它逃离鞍点的论文: 我与鬲融，金驰，黄芙蓉写的 Escaping From Saddle Points – Online Stochastic Gradient for Tensor Deco