台大李宏毅--梯度下降Gradient Descent

时间 2021-01-02

原文原文链接

一：简单梯度下降 1. 概述预测模型为 y=b+w∗xcp y = b + w ∗ x c p ,真实标签为 y^n y ^ n ，则损失函数loss function为我们目的是最小化损失函数L(w,b)，即找出最佳的 w∗,b∗ w ∗ , b ∗ 即处理方法：梯度下降法 2. 仅含一个参数的梯度下降对某一个参数的偏导数，就是对损失函数在这个参数的方向的斜率即，就是然后，不对