西瓜书之决策树的一生

最近看西瓜书的决策树这一章,给我看懵了。感觉得自己动手一步一步计算才能理解具体怎么构造的,然后才能写程序。就以书上的西瓜集2.0为例: 1.先搞清两个概念: 信息熵和信息增益 信息熵越小,纯度越高。计算公式如下: 条件熵: 信息增益越大,意味着获得的“纯属提升”越大。因此我们使用信息增益来进行决策树的划分属性选择。 计算过程如下: 插一句题外话,由上图可见手机镜头会让原图发生凹凸变化,所以镜子里的
相关文章
相关标签/搜索