MATLAB数据分析与挖掘 -- 数据探索篇

数据质量分析 主要是检查原始数据中是否存在脏数据,并做相应的处理,是数据预处理的前提,主要包括以下几种: 缺失值:记录的缺失或某个字段信息的缺失,一般的做法是删除、插补或者不作处理。 异常值:也即离群点,常用简单统计分析,3 σ \sigma σ原则,箱图分析。 1、简单统计分析:先对变量做一个描述性统计,进而查看哪些数据是不合理的,如199岁的年龄显然不合理); 2、3 σ \sigma σ原则
相关文章
相关标签/搜索