机器学习笔记(9)——随机森林算法(RandomForest,RF)

随机森林算法 RandomForest 1.概念 随机森林算法把分类树组合成随机森林,即在变量(列)的使用和数据(行)的使用上进行随机化,生成不少分类树,再汇总分类树的结果。随机森林在运算量没有显著提升的前提下提升了预测精度。随机森林对多元共线性不敏感,结果对缺失数据和非平衡的数据比较稳健,能够很好地预测多达几千个解释变量的做用。 2.优缺点 RF的主要优势有: 1) 训练能够高度并行化,对于大数
相关文章
相关标签/搜索