决策树系列(四)——C4.5

决策树系列(四)——C4.5 预备知识:决策树、ID3       如上一篇文章所述,ID3方法主要有几个缺点:一是采用信息增益进行数据分裂,准确性不如信息增益率;二是不能对连续数据进行处理,只能通过连续数据离散化进行处理;三是没有采用剪枝的策略,决策树的结构可能会过于复杂,可能会出现过拟合的情况。       C4.5在ID3的基础上对上述三个方面进行了相应的改进:       a)  C4.5
相关文章
相关标签/搜索