数据录入->数据采集->数据清洗(优化策略)

[html]  view plain  copy 最近听大神讲到对于项目的见解,因此以为收获颇多,因此在这里作个笔记,顺便分享给你们 我这里负责的是数据清洗的工做,有些时候,数据导入量很是大,达到几千万,几亿的数据量 因此对于这些大数据量的数据清洗,既须要效率,有须要质量,因此这是一个很是庞大的工做 总而言之就是:从源头控制数据质量,从源头进行数据清洗,就会减轻后面的工做量
相关文章
相关标签/搜索