【转】基本概念:过拟合、修剪、假正、假负

    一般会把整个训练集分红两个部分:拿数据的约 60-80 % 放入咱们的训练集,用来生成模型;而后拿剩下的数据放入一个测试集,在模型生成后,当即用其来测试咱们模型的准确性。     那么这个额外的步骤为何在此模型中如此重要呢?这个问题就是所谓的过拟合:若是咱们提供过多 数据用于模型建立,咱们的模型虽然会被完美建立,但只针对的是该数据。请记住:咱们想使用此模型来预测将来的未知数;咱们不是想使用
相关文章
相关标签/搜索