决策树先剪枝和后剪枝

(一)剪枝算法的简介:  剪枝一般是为了避免树的过于复杂,过于拟合而进行的一个动作,剪枝操作是一个全局的操作。 (二)预剪枝:  预剪枝就是在树的构建过程(只用到训练集),设置一个阈值(样本个数小于预定阈值或GINI指数小于预定阈值),使得当在当前分裂节点中分裂前和分裂后的误差超过这个阈值则分列,否则不进行分裂操作。 (三)后剪枝:  (1)后剪枝是在用训练集构建好一颗决策树后,利用测试集进行的操
相关文章
相关标签/搜索