集成学习(2)--bagging与随机森林

给定一个训练集,对训练样本进行采样,产生出若干个不同的子集,再从每个子集中训练一个基学习器。由于训练数据不同,基学习器可望有比较大的差异。但如果采样出的每个子集都完全不同,则每个基学习器只用到一小部分训练数据,甚至不足以有效学习,也就无法产生好的学习器。可以使用相互有交叠的采样子集解决。 Bagging Bagging是并行集成学习方法的代表,从名字可以看出它是基于自助采样法。即有放回的采样。 给
相关文章
相关标签/搜索