缺失数据处理

缺失数据意味着我们的数据集可能是不完整的,之前的例子中 德国的缺了薪水,西班牙的缺了年龄。对于缺失的数据最简单的处理方法就是删除这两行数据,但是这样的话可能会遗失重要的信息,所以要采取一个更好的方法,最常用的方法就是,取这一列的平均值,或者是最常见的值来对缺失的数据进行补充。 我们用工具来完成这个过程 from sklearn.preprocessing import Imputer sklear
相关文章
相关标签/搜索