数据分析学习——数据清洗

学习这么长时间的数据分析,却没有好好的做个总结,前段时间面试的时候,有面试官提问,如何做数据清洗。但由于平时缺少总结,回答的不是很好。于是博主决定好好地学习总结一番。 数据清洗主要针对一下几类脏数据:1)缺失值2)异常值3)重复值 缺失值 一、数据为什么会缺失 数据缺失主要分为两大类: 有意的:有些数据特征在设计的时候考虑会有缺失值的情况,而缺失数据往往不代表真的缺失,而是另有含义。比如:用户的子
相关文章
相关标签/搜索