数据的清洗

数据清洗一是为了解决数据质量问题,二是让数据更加适合做挖掘 一、解决数据质量问题 数据的完整性,比如人的属性中缺少性别、籍贯、年龄等 数据的唯一性,比如不同来源的数据出现重复的情况 数据的权威性,比如同一个指标出现多个来源的数据,且数值不一样 数据的合法性,比如数据与常识不符,市区内开车速度到达了400km/h 数据的一致性,比如不同来源的不同指标,实际的内涵与表示意义是一样的 数据清洗的结果是对
相关文章
相关标签/搜索