《Python数据分析与挖掘实战》笔记(三):数据探索

1.数据质量分析 主要任务是检查原始数据中是否存在脏数据,包括缺失值,异常值,不一致值,重复数据及特殊符号数据 缺失值,包括记录缺失和记录的某字段缺失等 产生缘由:没法获取、遗漏、属性值不存在; 影响:有用信息缺少、不肯定性加剧、不可靠 处理:删除、补全、不处理python 异常值,不合常理的数据,剔除可消除不良影响,分析可进行改进。异常值分析也称离群点分析。 经常使用的分析方法:简单统计量分析(
相关文章
相关标签/搜索