周志华机器学习笔记（一）

时间 2020-12-21

原文原文链接

2 模型评估与选择 2.2 评估方法 2.2.1留出法留出法直接将数据集D划分为两个互斥的集合，其中一个集合作为训练集S，另一个作为测试集T。在S上训练出模型后，用T来评估其测试误差，作为对泛化误差的估计。注意：训练/测试集的划分尽可能保持数据分布的一致性，避免因数据划分过程引入额外的偏差而对最终结果产生影响。常见做法是将大约2/3~4/5的样本用于训练，剩余样本用于测试 2.2.2 交叉验证

>>阅读原文<<