11 数据清洗

在数据分析过程中,数据清洗在时间上占到了80%。 数据质量的准则(“完全合一”) (1)完整性:单条数据是否存在空值,统计的字段是否完善。 (2)全面性:观察某一列的全部数值,通过常识来判断该列是否有问题。 (3)合法性:数据的类型、内容、大小的合法性。 (4)唯一性:数据是否存在重复记录 数据清理要使数据标准、赶紧、连续,为后续数据统计、数据挖掘做好准备。 1、完整性 问题1:缺失值 解决办法:
相关文章
相关标签/搜索