机器学习笔记(6)——C4.5决策树中的剪枝处理和Python实现

1. 为什么要剪枝 还记得决策树的构造过程吗?为了尽可能正确分类训练样本,节点的划分过程会不断重复直到不能再分,这样就可能对训练样本学习的“太好”了,把训练样本的一些特点当做所有数据都具有的一般性质,cong从而导致过拟合。这时就可以通过剪枝处理去掉yi一些分支来降低过拟合的风险。 剪枝的基本策略有“预剪枝”(prepruning)和“后剪枝”(post-pruning): 预剪枝是在决策树的生成
相关文章
相关标签/搜索