决策树的python代码

决策树学习算法包含特征选择、决策树的生成与剪枝过程。决策树的学习算法一般是递归地选择最优特征,并用最优特征对数据集进行分割。由于决策树表示条件概率分布,所以高度不同的决策树对应不同复杂度的概率模型。最优决策树的生成是个NP问题,能实现的生成算法都是局部最优的,剪枝则是既定决策树下的全局最优。 A特征选择: 如何判断一个特征的分类能力呢?有以下两种方法:1、信息增益;2、信息增益比。 信息增益: 对
相关文章
相关标签/搜索