谷歌机器学习速成课程笔记 13(Regularization for Sparsity-稀疏性正则化)

特征组合很实用但也有一些问题,尤其是将稀疏特征组合起来的时候。 (接上图)那么我们可能会遇到数百万个可能存在的字词和数百万个可能存在的视频,这些内容一旦组合起来,便会产生大量的系数,这就意味着,模型会突然增大从而占满内存,还可能减缓运行时间。 并且,尽管我们拥有大量的训练数据,但其中仍有许多组合会非常罕见,因此我们最终可能会得到一些噪声系数,并可能产生过拟合。如果产生过拟合,就要进行正则化。 现在
相关文章
相关标签/搜索