台湾大学林轩田《机器学习基石》学习笔记第5讲——Training versus Testing

一、Recap and Preview 我们先来看一下基于统计学的机器学习流程图: 该流程图中,训练样本D和最终测试h的样本都是来自同一个数据分布,这是机器能够学习的前提; 另外,训练样本D应该足够大,且hypothesis set的个数是有限的,这样根据霍夫丁不等式,才不会出现BadData,保证Ein≈Eout,即有很好的泛化能力; 同时,通过训练,得到使Ein最小的h,作为模型最终的矩g,g
相关文章
相关标签/搜索