使用 MapReduce 处理用电数据

1,数据清洗:将不规整数据转化为规整数据         刚刚采集到HDFS中的原生数据,咱们也称为不规整数据,即目前来讲,该数据的格式还没法知足咱们对数据处理的基本要求,须要对其进行预处理,转化为咱们后面工做所须要的较为规整的数据,因此这里的数据清洗,其实指的就是对数据进行基本的预处理,以方便咱们后面的统计分析,因此这一步并非必须的,须要根据不一样的业务需求来进行取舍,只是在咱们的场景中须要对数
相关文章
相关标签/搜索