Random Forest

自助采样法 给定包含m 个样本的数据集D , 我们对它进行采样产生数据集D': 每次随机从D 中挑选一个样本将其拷贝放入D' 再将该样本放回初始数据集D 中,使得该样本在下次采样时仍有可能被采到; 这个过程重复执行m 次,我们就得到了包含m个样本的数据集D' 通过自助来样,初始数据集D 中约有36.8% 的样本未出现在采样数据集D'中.于是我们可将D' 用作训练集,用作测试集;这样我们仍有数据总量
相关文章
相关标签/搜索