分享 :准备数据时如何避免数据泄漏

作者:Jason Brownlee   翻译:张一然  校对:李洁 本文约5000字,建议阅读10分钟。 本篇文章主要介绍了几种常用的数据准备方法,以及在数据准备的过程中如何避免数据泄露。 数据准备是将原始数据转换为适合建模的形式的过程。 原始的数据准备方法是在评估模型性能之前对整个数据集进行处理。这会导致数据泄漏的问题, 测试集中的数据信息会泄露到训练集中。那么在对新数据进行预测时,我们会错误地
相关文章
相关标签/搜索