数据挖掘--决策树C4.5算法(例题)

C4.5算法与ID3算法的不一样点: (1)分支指标采用增益比例 (2)数值属性的处理 (3)处理缺乏属性值的训练样本 (4)使用K次迭代交叉验证,评估模型的优劣程度; (5)根据生成的决策树,能够产生一个if-then规则的集合。web 计算的步骤: 1.对数据源进行预处理 2.计算每一个属性的信息增益和信息增益率 3.根节点属性每个可能的取值对应一个子集,对样本子集递归地执行以上Step2过
相关文章
相关标签/搜索