交叉验证:评估模型表现

注明:本文章所有代码均来自scikit-learn官方网站 在实际情况中,如果一个模型要上线,数据分析员需要反复调试模型,以防止模型仅在已知数据集的表现较好,在未知数据集上的表现较差。即要确保模型的泛化能力,它指机器学习对新鲜样本的适应能力。只有保证模型的泛化能力,模型的构建才有意义。因此,交叉验证在整个建模流程中显得尤为重要。 如果不对数据集进行处理,而仅是用含有标签的已知数据训练模型会得到很高
相关文章
相关标签/搜索