Python3机器学习实践:集成学习之随机森林

随机森林步骤: 构建多个数据集 在包括N个样本的数据集中,采用有放回的抽样方式选择N个样本,构成中间数据集,然后在这个中间数据集的所有特征中随机选择几个特征,作为最终的数据集。以上述方式构建多个数据集;一般回归问题选用全部特征,分类问题选择全部特征个数的平方根个特征 为每个数据集建立完全分裂的决策树 利用CART为每个数据集建立一个完全分裂、没有经过剪枝的决策树,最终得到多棵CART决策树; 预测
相关文章
相关标签/搜索