决策树(decision tree)——连续值处理

转载至决策树(decision tree)(三)——连续值处理 | 连续值处理     因为连续属性的可取值数目不再有限,因此不能像前面处理离散属性枚举离散属性取值来对结点进行划分。因此需要连续属性离散化,常用的离散化策略是二分法,这个技术也是C4.5中采用的策略。下面来具体介绍下,如何采用二分法对连续属性离散化:      下面举个具体的例子,来看看到底是怎样划分的。给定数据集如下(数据集来自周
相关文章
相关标签/搜索