西瓜书模型评估与选择

经验误差和过拟合 一句话概括就是训练集的样本要尽可能好,尽可能准确,机器才会学到好的经验,这样预测才准确。 过拟合就是加入了一些无关痛痒的特征,比如上图,是不是树叶跟有没有锯齿没有关系,所以有无锯齿不能作为特征;欠拟合指的是特征太少导致无法准确预测。 评估方法 不管什么评估方法,测试样本与训练样本要尽可能不同。 留出法 留出法简言之就是将已有数据集的80%作为训练集,20%作为测试集,通常是这么分
相关文章
相关标签/搜索