斯坦福大学机器学习笔记——当训练模型性能不好时的措施(假设评估、模型选择和交叉验证集、正则化、学习曲线)

以我们前面讲述的线性回归为例,比如我们在训练集上训练出最优的模型,但是当我们将其使用到测试集时,测试的误差很大,我们该怎么办? 我们一般采取的措施主要包括以下6种: 增加训练样本的数目(该方法适用于过拟合现象时,解决高方差。一般都是有效的,但是代价较大,如果下面的方法有效,可以优先采用下面的方式); 尝试减少特征的数量(该方法适用于过拟合现象时,解决高方差); 尝试获得更多的特征(该方法适用于欠拟
相关文章
相关标签/搜索