机器学习缺失值处理方法汇总

1. 用平均值、中值、分位数、众数、随机值等替代。效果通常,由于等于人为增长了噪声。html 2. 用其余变量作预测模型来算出缺失变量。效果比方法1略好。有一个根本缺陷,若是其余变量和缺失变量无关,则预测的结果无心义。若是预测结果至关准确,则又说明这个变量是不必加入建模的。通常状况下,介于二者之间。网络 3. 最精确的作法,把变量映射到高维空间。好比性别,有男、女、缺失三种状况,则映射成3个变量:
相关文章
相关标签/搜索