R语言分类算法之随机森林(Random Forest)

1.原理分析: 随机森林是经过自助法(boot-strap)重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练集样本集合,而后根据自助样本集生成k个决策树组成的随机森林,新数据的分类结果按照决策树投票多少造成的分数而定. 通俗的理解为由许多棵决策树组成的森林,而每一个样本须要通过每棵树进行预测,而后根据全部决策树的预测结果最后来肯定整个随机森林的预测结果.随机森林中的每一颗决
相关文章
相关标签/搜索