MapReduce实现简单join(利用框架排序机制)

输入数据 有以下两个输入文件a.txt和b.txt,目的是将其按照第一列进行join,输入文件如下: 利用MR进行join 思路是利用框架的排序机制,先用一个MapReduce(此时不对reduce进行任何编码)将两个文件的数据以<key,flag,value>的形式输出(flag=1表示来自a.txt,flag=2来自b.txt),具体分别对a.txt和b.txt执行map_a.py和map_b
相关文章
相关标签/搜索