决策树(decision tree)——连续值处理

转载至决策树(decision tree)(三)——连续值处理 | 连续值处理     由于连续属性的可取值数目再也不有限,所以不能像前面处理离散属性枚举离散属性取值来对结点进行划分。所以须要连续属性离散化,经常使用的离散化策略是二分法,这个技术也是C4.5中采用的策略。下面来具体介绍下,如何采用二分法对连续属性离散化:      下面举个具体的例子,来看看究竟是怎样划分的。给定数据集以下(数据集
相关文章
相关标签/搜索