关于训练集、验证集、测试集及数据不同时的情况

定义 训练集用来拟合参数,验证集用来查看参数的好坏,测试集在完成后测试置信度确保不会出问题。 划分 传统的分法是把数据集分成训练集(70%)和测试集(30%),或者在需要交叉验证集时分为:训练集(60%)、交叉验证集(20%)、测试集(20%)。 但是现在是大数据时代,假设你的数据量大于100万,那么可以分成训练集(98%)、交叉验证集(1%)、测试集(1%)。因为10000个数据已经具有普遍性了
相关文章
相关标签/搜索