决策分类算法-C4.5算法原理

与ID3的不一样之处:算法 (1)分支指标采用增益比例,而不是ID3所使用的信息增益;spa (2)按照数值属性值的大小对样本排序,从中选择一个分割点,划分数值属性的取值区间,从而将ID3的处理能力扩充到数值属性上来。blog (3)将训练样本集中的位置属性值用最经常使用的值代替,或者用该属性全部取值的平均值代替,从而处理缺乏属性值的训练样本。排序 (4)使用k次迭代交叉验证,评估模型的优劣程度i
相关文章
相关标签/搜索