决策树中连续型值和缺失值处理

连续值处理 上篇介绍了几种按数据属性对决策树划分的方法,下面考虑一下一些连续型的属性应该怎样处理。html 处理连续型属性(例如西瓜的成熟度、学生成绩)时,须要将其离散化,将连续型属性的值划分到不一样的区间(相似于二叉排序树),比较各个分裂点的Gain值的大小。 在C4.5决策树算法中,采用二分法处理连续型属性。 例子: 假设有连续属性a,D={ a 1 , a 2 , . . . a i . .
相关文章
相关标签/搜索