机器学习入门——正则化

问题引入 当预测函数的项次数过高时,算法为了降低代价,也就是差异,会跑出一条畸形的曲线。 虽然这条畸形的曲线完美的拟合了所有的数据点,但是显然这样一条曲线并不具有可推广性、泛化性。对于以后给出的数据也不能准确的预测。这种情况称为拟合过度。 一般在数据量较小,而特征值较多的情况下,过度拟合发生的概念较高。 正则化 为了在保留较小的高次项的基础上,解决过度拟合,我们需要进行正则化。 我们对于原有的代价
相关文章
相关标签/搜索