机器学习笔记(XIII)决策树(III)连续与缺失值

连续值处理 对于连续属性的可取数目再也不有限,所以,不能直接根据连续属性的可取值来对结点进行划分。web 连续离散化之二分法 具体作法 对于给定的样本集 D 和连续属性 a ,假定 a 在 D 上出现了 n 个不一样的取值,将这些值从小到大进行排序,记为 {a1,a2,…,an} 。基于划分点 t 可将 D 分为子集 D−t 和 D+t , 若 ai∈D−t 则 ai≤t 若 ai∈D+t 则 a
相关文章
相关标签/搜索