数据挖掘算法02 - C4.5

C4.5 决策树学习通常包括三个步骤 特征选择。选取最优特征来划分特征空间,用信息增益或者信息增益比来选择 决策树的生成。ID3、C4.5、CART 剪枝 什么是信息熵? 随机变量 x 概率 P(x) 表示 x 出现的概率 信息量 H(x)=−log(P(x)) 信息量是信息论中的一个度量,简单来说就是,当我们观察到某个随机变量的具体值时,接收到了多少信息。 而我们接收到的信息量跟发生事件的概率有
相关文章
相关标签/搜索