机器学习、数据挖掘-推荐系统问题总结

参考各种资料总结一下,准备面试。更新中~ 1、过拟合与欠拟合 过拟合:在训练数据集上表现较好,在测试集上表现较差。 可能的原因: 参数太多,模型复杂度高。 样本噪声数据较大,模型学到了噪声数据的特征。 对于决策树模型,对于决策树的生长没有进行合理的限制和修剪。 对于神经网络,迭代次数太多(overtraining),拟合数据中的噪声和无代表性的特征。 解决方法: 降低模型复杂度,使用简单的模型 增
相关文章
相关标签/搜索