什么是梯度下降?

梯度下降 为什么需要引入梯度下降? 通过之前通过线性回归已经求出了目标函数(现在需要使得目标函数越小越好)这里又求解过程,总之现在目标函数长这个样子: 1. 为什么要除了m这个样本总数呢? 因为假设10万份样本和5万份样本,显而易见10万份的样本损失一定更大,而在这里我们是为了得到一个与样本数量无关的泛值。 2. 那么为什么要引入梯度下降呢?直接求偏导数找到极值点不就可以了吗? 因为求偏导的过程有
相关文章
相关标签/搜索