1.6模型的比较和检验

在选择合适的评估方法和相应的性能度量时,计算出性能度量后直接进行比较,会存在以下问题: 模型评估得到的是测试集上的性能,并非严格意义上的泛化性能,两者并不完全相同 测试集上的性能与样本选取关系很大,不同的划分,测试结果会不同,比较缺乏稳定性 很多模型本身有随机性,即使参数和数据集相同,其运行结果也可能存在差异 上述问题按照统计学的知识描述为:已知两个模型 f1和f2 ,两者的泛化性能在测试集上的表
相关文章
相关标签/搜索