连续与缺失值-----决策树

连续与缺失值 决策树给咱们的印象更可能是处理离散属性,可是在实际的任务中也会遇到连续属性,或者属性中有缺失值的状况,那么咱们对于这种数据咱们如何进行处理。算法 1. 连续值处理 由于连续属性的可取值数目再也不有限,所以,不能直接根据连续属性的可取值来对结点进行划分,不然,这样的决策树毫无泛化能力。因此,咱们将连续属性进行离散化。最简单的策略是采用“二分法”,C4.5决策树算法中也是使用的这种机制。
相关文章
相关标签/搜索