hadoop实现Join的几种方法

1) reduce side join reduce side join是一种最简单的join方式,其主要思想以下: 在map阶段,map函数同时读取两个文件File1和File2,为了区分两种来源的key/value数据对,对每条数据打一个标签 (tag), 好比:tag=0表示来自文件File1,tag=2表示来自文件File2。即:map阶段的主要任务是对不一样文件中的数据打标签。 在red
相关文章
相关标签/搜索