决策树(Decision Tree)算法原理

1.熵的概念 不确定性越大熵就越大,不确定性越小熵就越小 说明A的不确定性最大,B的不确定性较小,C是一个确定性事件所以熵为0 2.ID3算法 ID3算法是通过信息增益的计算来选择根节点的划分 会发现age的信息增益最大,根据ID3算法,始终选择信息增益最大的作为根节点,所以把age作为根节点 决策树生成第一层之后,在每个叶子节点重复上面的操作再确定下一个分支结点 同时对于连续变量的处理我们可以在
相关文章
相关标签/搜索