大数据ETL实践探索(8)---- 数据清洗的目的,方法

文章大纲 数据清洗的目的 解决数据质量问题 让数据更适合做挖掘、展示、分析 数据清洗的步骤 第0步:数据导入及元数据处理 第一步:缺失值清洗 第二步:格式内容清洗 第三步:逻辑错误清洗 第四步:非需求数据清洗 第五步:关联性验证 一行代码探索性数据分析 参考文献 我们目前进入了一个大数据的时代。以我目前经常处理的医疗保健数据为例。 随着时间的推移医疗保健数据的生成速度越来越快,预计到2020年将达
相关文章
相关标签/搜索