决策树算法学习笔记(提升篇)

声明:本文虽有部分自己理解成分,但是大部分摘自以下链接。 决策树(decision tree)(三)——连续值处理 决策树参数讲解+实例 数据挖掘十大算法 C4.5算法的改进: 用信息增益率来选择属性。 在树构造过程中进行剪枝,在构造决策树的时候,那些挂着几个元素的节点,不考虑最好,不然容易导致overfitting。 对非离散数据也能处理。 能够对不完整数据进行处理。 修剪枝叶 原因:避免产生过
相关文章
相关标签/搜索