C4.5算法

C4.5算法 ID3算法的局限性: 针对属性取值个数不一样(通常个数悬差很大),比如,银行分析客户透支因素:性别,职业,居住城市,由于三个属性取值个数差异较大,该情况下就不适合ID3算法。 ID3算法局限性原因: 针对同样重要,区分力相同的两个条件属性,但是如果一个属性取值总数比较多,很可能对应的信息增益较大,存在误导用户选择属性的可能。 ID3算法局限性的处理手段: 压缩属性,划分区间(比如居住
相关文章
相关标签/搜索