【机器学习课程-华盛顿大学】:3 分类 3.4(2) 决策树处理丢失数据

1、丢失数据处理方法:丢弃 (1)丢弃缺失的数据点:这种方法要保证丢失的数据点不要太多,否则删除的太多   (2)丢弃缺失的特征:这种方法要保证丢失的特征点不要太多   优点:容易理解;容易在各种模型中实现 缺点:丢失数据将造成信息丢失;无法权衡到底是丢弃特征还是数据点;当预测数据也有丢失的时候,很难预测;   2、丢失数据处理方法:填充 (1)填充自己计算出现的值:最常出现的值,均值,中值等。
相关文章
相关标签/搜索