决策树的预剪枝和后剪枝,连续值与缺失值

预剪枝是指在决策树生成过程中,对每个结点在划分前先进行估计,若当前结点的划分不能带来决策树泛化性能提升,则停止划分并将当前结点标记为叶子结点。 优点:算法简单,效率高,适合解决大规模问题 缺点:有欠拟合的风险   后剪枝是先从训练集生成一颗完整的决策树,然后自底向上地对非叶子结点进行考察,若将该结点对应的子树替换为叶子结点能带来决策树泛化性能提升,则将该子树替换为叶子结点。 优点:相比于预剪枝,泛
相关文章
相关标签/搜索