hadoop 之MR的join操作

在SQL语句中,我相信大家都使用Join操作,但是今天我来谈谈MapReduce中的join操作是如何进行的。 先来看一下在join的效果 如果对MR熟悉的同学,应该清楚map在把数据处理完之后是会经过shuffle过程的。数据真正到达reduce的是已经被分好类的。那么什么是分好类的呢? 就想上面的表所示,如果我们把基本信息和额外信息作为map输入的内容,那么我们可以得到如下的数据: 1 张三
相关文章
相关标签/搜索