83-基尼系数

基尼系数      上一篇博客主要使用信息熵这样的方式对决策树每一个节点上相应的数据进行一个划分,然后一点一点构建出一颗决策树来。其实我们还可以使用另外一个指标对我们的决策树每个节点的数据进行划分,这个指标就是基尼系数。      基尼系数的计算比信息熵简单很多,公式如下:   我们还是使用几个小例子观察求出来的结果是怎样的。      如果数据分成三类,每类所占比例均是 1/3,那么基尼系数为:
相关文章
相关标签/搜索