分类与回归树(CART,Classification And Regression Tree)

分类回归树也属于一种决策树。 分类回归树是一棵二叉树,且每个非叶子节点都有两个孩子。 构建决策树时通常采用自上而下的方法,在每一步选择一个最好的属性来分裂。 "最好" 的定义是使得子节点中的训练集尽量的纯。不同的算法使用不同的指标来定义"最好"。本部分介绍一种最常见的指标。 GINI指数: 1、是一种不等性度量; 2、通常用来度量收入不平衡,可以用来度量任何不均匀分布; 3、是介于0~1之间的数,
相关文章
相关标签/搜索