数据整合和数据清洗

发现数据问题类型 脏数据或数据不正确 • 比如 ‘0’ 代表真实的0,还是代表缺失;Age = -2003 • 数据不一致  比如收入单位是万元,利润单位是元,或者一个单位是美元,一个是人民币 • 数据重复 • 缺失值 • 离群值 数据探索识别噪声 利用图形可以直观快速地对数据进行初步分析: • 直方图、饼图、条形图、折线图、散点图等 错误值处理 发现错误值只能通过描述性统计的方法,逐一核实每个变
相关文章
相关标签/搜索