python数据探索

第三章 数据探索 3.1 数据质量分析 脏数据包括:缺失值;异常值;不一致的值;重复数据及含有特殊符号的数据; 1.缺失值处理 统计缺失率,缺失数 2.异常值处理 (1)简单统计量分析 (2)3Q原则 正态分布状况下,小几率事件为异常值 不服从正太分布的,能够用原离平均值多少倍标准差来分析 (3)箱线图分析 使用describe()描述html import pandas as pd cater
相关文章
相关标签/搜索