数据挖掘 -- C4.5决策树算法

1. 算法原理 C4.5算法: 首先根据训练集求出各属性的信息熵info, 而后求出类别信息商infod, infod - info[i]获得每一个属性的信息增益gain, 而后计算每一个属性的信息分裂度h, gain[i] / h[i]获得属性信息增益率。递归选择信息增益率最高的属性,按照该属性对数据集进行分裂,判断分裂以后的数据集类别是否为’纯’的,若是是则将当前分裂属性做为叶节点,若是不是继
相关文章
相关标签/搜索