决策树中基尼不纯度初步理解

基尼不纯度:从一个数据集中随机选取子项,度量其被错误的划分到其余组里的几率。(书上解释)python         一个随机事件变成它的对立事件的几率(简单理解)spa 计算公式:(fi为某几率事件发生的几率)3d 下图是相关曲线图,能够参考数据挖掘导论的98页: code 从上图能够看出,基尼系数和熵之半的曲线很是接近,仅仅在45度角附近偏差稍大。所以,基尼系数能够作为熵模型的一个近似替代。x
相关文章
相关标签/搜索