CART算法中的基尼指数(转载)

基尼指数 定义 是一种不等性度量; 通常用来度量收入不平衡,可以用来度量任何不均匀分布; 是介于0~1之间的数,0-完全相等,1-完全不相等; 总体内包含的类别越杂乱,基尼指数就越大 基尼不纯度指标 在CART算法中, 基尼不纯度表示一个随机选中的样本在子集中被分错的可能性。基尼不纯度为这个样本被选中的概率乘以它被分错的概率。当一个节点中所有样本都是一个类时,基尼不纯度为零。 假设y的可能取值为{
相关文章
相关标签/搜索