邱锡鹏 神经网络与深度学习课程【十】——网络优化与正则化1和2

深度学习的矛与盾  网络优化的难点  高维空间的非凸优化问题: 要逃离鞍点 在某些曲线上是最高点 而在另一些曲线上是最低点这样的点称为鞍点    一些可视化的模型 一般都要加上残差网络  改善方法:  优化算法的改进: 随机GD 改进 为 小批量随机GD MiniBatch  批量大小的影响: batch size 属于超参 比较经验性的  如何改进?  学习率衰减 衰减函数: 阶梯衰减 线性衰减
相关文章
相关标签/搜索