Hadoop中MapReduce实现join的几种方法

Hadoop中MapReduce实现join的几种方法 1.reduce side joinreduce side join是一种最简单的join方式,其主要思想以下: 在map阶段,map函数同时读取两个文件File1和File2,为了区分两种来源的key/value数据对,对每条数据打一个标签 (tag),好比:tag=0表示来自文件File1,tag=2表示来自文件File2。即:map阶段
相关文章
相关标签/搜索