DC数据清理(pandas、seabron)

格式转换 数据的原始储存形式未必适合Python的数据处理 例如:时间,字符串转其他 缺失数据 每条数据都可能在某些属性值上缺失 怎样应对缺失数据 忽略有缺失数据的记录 直接把值标记成未知 利用平均值、最常出现的值等去填充(有很多复杂的方法。) 异常数据 出现不符合常识的数据(异常挖掘) 处理方式类比缺失数据 数据标准化 US、USA、united states------>美国(USA) 住址范
相关文章
相关标签/搜索