机器学习笔记(二)—— 判断模型的好坏

一、 划分训练集和测试集 训练集:用于训练模型的集合 测试集:用于测试训练模型的集合。 常见的数据集拆分方法: 1. 留出法 留出法(hold-out)直接将数据集D拆分成两个互斥的集合,其中一个作为训练集S,另一个作为测试集T。即D=S∪T,S∩T=∅。在S上训练出模型后,用T来评估其测试误差,作为对泛化误差的估计。 注意:(1)训练/测试集的划分要尽可能保持数据分布的一致性,避免因数据划分过程
相关文章
相关标签/搜索