随机森林及GBDT

随机性主要体现在两个方面:(1)训练每棵树时,从全部训练样本(样本数为N)中选取一个可能有重复的大小同样为N的数据集进行训练(即bootstrap取样);(2)在每个节点,随机选取所有特征的一个子集,用来计算最佳分割方式。 优点 1、 在当前的很多数据集上,相对其他算法有着很大的优势,表现良好 2、它能够处理很高维度(feature很多)的数据,并且不用做特征选择         PS:特征子集是
相关文章
相关标签/搜索