机器学习中训练集和测试集比例

在搜索机器学习相关信息偶然看到一篇文章的图片。了解不同数据情况下的数据配比。这里记录下: 当数据量比较小时,可以使用 7 :3 训练数据和测试数据 (西瓜书中描述 常见的做法是将大约 2/3 ~ 4/5 的样本数据用于训练,剩余样本用于测试) 或者 6: 2 : 2 训练数据,验证数据和测试数据 当数据量非常大时,可以使用 98 : 1 : 1 训练数据,验证数据和测试数据   这个配比和 孙高飞
相关文章
相关标签/搜索