【机器学习】【决策树】C4.5算法,详解+python代码实现

ID3算法只有树的生成,因此该算法生成的树容易产生过拟合,C4.5在生成的过程,用信息增益比来选择特征。node ID3算法以信息增益做为划分训练数据集的特征,存在缺点:偏向于选择特征值较多的特征。python C4.5算法使用信息增益比(information gain ratio),能够对ID3算法这一缺点进行校订算法 注意:先计算数据集全部特征的信息增益比的平均值,而后找到信息增益比大于平均
相关文章
相关标签/搜索