Hadoop之MapReduce的Join解析

代码存于github:https://github.com/zuodaoyong/Hadoop 1、Reduce Join(会出现数据倾斜) 通过将关联条件作为Map输出的key,将两表满足Join条件的数据并携带数据所来源的文件信息,发往同一个ReduceTask,在Reduce中进行数据的串联 需求:将商品信息表中数据根据商品pid合并到订单数据表中 订单数据: Id pid amount 1
相关文章
相关标签/搜索