Python_数据清洗

python--数据清洗 1.数据错误: 错误类型 – 脏数据或错误数据 • 比如, Age = -2003 – 数据不正确 • ‘0’ 代表真实的0,还是代表缺失 – 数据不一致 • 比如收入单位是万元,利润单位是元,或者一个单位是 美元,一个是人民币 – 数据重复 2.缺失值处理: 处理原则 –缺失值少于20% •连续变量使用均值或中位数填补 •分类变量不需要填补,单算一类即可,或者用众数填补
相关文章
相关标签/搜索