决策树—连续值处理

       由于连续属性的可取值数目再也不有限,所以不能像前面处理离散属性枚举离散属性取值来对结点进行划分。所以须要连续属性离散化,经常使用的离散化策略是二分法,这个技术也是C4.5中采用的策略。下面来具体介绍下,如何采用二分法对连续属性离散化:git 下面举个具体的例子,来看看究竟是怎样划分的。给定数据集以下(数据集来自周志华《机器学习》,我已经把数据集放到github上了,地址为:西瓜数据集
相关文章
相关标签/搜索