数据清洗(三)------检查数据逻辑错误

检查数据逻辑错误

数据逻辑错误通常分两种:(1)被调查者输入的选项不符合要求。eg:最多3个选项的多选题,答题者选了4个选项。

                                            (2)录入错误。eg:二分法的多选题录入时,出现了0和1以外的数据。

检查方法:if函数和or函数

IF(logical_test,value_if_true,value_if_false)

OR(logical1,logical2,logical3,.......)----至少一个参数为真,就返回true

AND(logical1,logical2,logical3,.......)--所有参数都为真时,才返回true

(一)用IF函数检查第一类错误

有4道题,每道题有ABCDEFG个选项,每个选项被选中则为1,否则为0,既不为0又不为1的属于录入错误。



如上图所示,在 I21单元格内输入=IF(COUNTIF(B21:H21,"<>0")>3,"错误","正确")等式,在检验列的剩下单元格也输入相应的等式。由结果可知,被调查者在答第2道题的时候输入的选项不符合要求。


(二)用条件格式和OR函数标记录入错误

开始---条件格式---突出显示单元格规则---其他规则---使用公式确定要设置格式的单元格---在“为符合此公式的值设置格式”文本框中输入“=OR(B21=1,B21=0)=FALSE”



由上图所示,录入错误即被标记出来。