随机森林筛选变量(Python实现)

#文章转自每日一Python公众号 app 当数据集的特征过多时,容易产生过拟合,能够用随机森林来在训练以后能够产生一个各个特征重要性的数据集,利用这个数据集,肯定一个阈值,选出来对模型训练帮助最大的一些特征,筛选出重要变量后能够再训练模型;dom 本文所用数据集是从kaggle网站上下载的lend club数据,经过随机森林筛选出对预测是否逾期的重要性变量:网站 # 首先导入数据,查看数据集的基
相关文章
相关标签/搜索