过拟合问题

过拟合定义 在给定的一个假设空间 H ,一个假设属于 h ,如果存在其他的假设 h, ,属于 H ,使得在训练样例上 h 的错误率比 h, 小,但在整个实例分布上 h, 比 h 错误率小,那么说假设 h 过度拟合了训练数据。 通俗一点说,就是在提升模型(上面所说的假设)在训练数据上的表现,在测试集上的表现反而变差。或者说将不仅学习到了数据的一般规律,还将非一般规律(数据的特异点或者离群点)学习到了
相关文章
相关标签/搜索