第十八章 大规模机器学习

课时140 学习大数据集 以线性回归模型为例,每一次梯度下降迭代,都要计算训练集的误差平方和,计算量很大。 首先应该做的是画学习曲线,判断大规模数据集有没有必要,左图说明需要增加数据量,右图说明应该添加额外的特征或增加神经网络的隐藏单元等。 课时141 随机梯度下降stochastic gradient descent 之前用的梯度下降方法也叫批梯度下降batch gradient descent
相关文章
相关标签/搜索