机器学习系列-数据拆分和结果评价

1.数据集分类 机器学习中的数据分为训练数据集、验证数据集和测试数据集。 通常,在训练有监督的机器学习模型的时候,会将数据划分为训练集、验证集合测试集,划分比例一般为0.6:0.2:0.2。对原始数据进行三个集合的划分,是为了能够选出效果(可以理解为准确率)最好的、泛化能力最佳的模型。 训练集(Training set) 作用是用来拟合模型,通过设置分类器的超参数,训练分类模型。后续结合验证集作用
相关文章
相关标签/搜索