数据挖掘面试题之随机森林(RF)

随机森林   模型收到低偏差和高方差问题的困扰,应该如何解决 低偏差意味着模型的预测值接近实际值。换句话说,该模型有足够的灵活性,以模仿训练所有数据的分布。貌似很好,但是别忘了,一个过于灵活的模型是没有泛化能力的。这意味着,当这个模型用在对一个未曾见过的数据集进行测试的时候,它会令人很失望。 在这种情况下,我们可以使用bagging算法(如随机森林),以解决高方差问题。 bagging算法采用bo
相关文章
相关标签/搜索