数据探索之数据质量分析

数据质量分析的主要任务是检查原始数据中是否存在脏数据,脏数据一般指的是不符合要求,以及不能直接进行相应分析的数据。数据的质量分析侧重于脏数据的发现,而数据清洗则是对这些脏数据的修正或者丢弃。一般情况下,数据的质量分析与数据清洗是相伴而行的,在分析出脏数据的时候伴随着数据的清洗。 常见的脏数据包括如下: 1.缺失值 缺失值产生的一般由如下原因造成: (1) 有些信息无法获取; (2) 有些信息出现遗
相关文章
相关标签/搜索