决策树中连续值与缺失值的处理方法

连续值的处理方法 对于连续属性,不能直接根据连续属性的可取值对节点进行划分,可以使用二分法对连续属性进行划分。 划分方法 假设数据集 D D D中的属性 a a a是连续的,那么对于 a a a中的结点,每两个结点取中值作为候选划分点,然后就可以像离散属性值一样处理这些候选划分点。 G a i n ( D , a , t ) = E n t ( D ) − ∑ ∣ D t k ∣ ∣ D ∣ E
相关文章
相关标签/搜索