周志华机器学习笔记(一)

2 模型评估与选择 2.2 评估方法 2.2.1留出法 留出法直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T。在S上训练出模型后,用T来评估其测试误差,作为对泛化误差的估计。 注意:训练/测试集的划分尽可能保持数据分布的一致性,避免因数据划分过程引入额外的偏差而对最终结果产生影响。常见做法是将大约2/3~4/5的样本用于训练,剩余样本用于测试 2.2.2 交叉验证
相关文章
相关标签/搜索