《动手学深度学习Pytorch版》Task3-过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸

过拟合、欠拟合 训练/泛化误差 训练误差(training error)和泛化误差(generalization error)。通俗来讲,前者指模型在训练数据集上表现出的误差,后者指模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。 欠拟合 模型无法得到较低的训练误差,我们将这一现象称作欠拟合(underfitting) 过拟合 模型的训练误差远小于它在测试数据集
相关文章
相关标签/搜索