训练集和测试集 (Training and Test Sets):拆分数据

将数据集分为两个子集: 训练集 - 用于训练模型的子集。 测试集 - 用于测试训练后模型的子集。 如果只有一个数据集的话,可以将数据集分开: 图 1. 将单个数据集拆分为一个训练集和一个测试集。 但要确保测试集满足以下两个条件: 规模足够大,可产生具有统计意义的结果。 能代表整个数据集。换言之,挑选的测试集的特征应该与训练集的特征相同。 假设测试集满足上述两个条件,目标是创建一个能够很好地泛化到新
相关文章
相关标签/搜索