监督学习(七)——决策树集成:随机森林

决策树经常会对训练数据进行过拟合,也就是训练数据精度高,而预测结果很低。随机森林就是许多决策树的集合,每一棵决策树跟其他决策树都不同,每棵树都会不同方式的过拟合,那么对这些树的结果取平均值,就可以降低过拟合。 随机森林的随机方法有两种: 1、通过选择用于构造树的数据点; 2、通过选择每次划分测试的特征。 一、构造随机森林 构造一个随机森林模型,需要先确定用于构造的树的个数 (RandomFores
相关文章
相关标签/搜索