李宏毅机器学习入门学习笔记(三)Gradient Descent

文章目录 什么是Gradient Descent(梯度下降法)? Review: 梯度下降法 Tip1:调整 learning rates(学习速率) 小心翼翼地调整 learning rate 自适应 learning rate Adagrad 算法 Adagrad 是什么? Adagrad举例 Adagrad 存在的矛盾? 多参数下结论不一定成立 Adagrad 进一步的解释 Tip2:Sto
相关文章
相关标签/搜索