图解MapReduce各种join的使用

  1、Reduce side join:在reduce端进行连接 2、半连接:在map端将数据过滤,降低数据量,在reduce端连接 3、Map side join:在map端进行join 4、二次排序 基本原理是将key和部分value拼接成一个组合key(实现WritableComparable接口或者调用setSortComparatorClass函数),这样reduce获取的结果便是先按
相关文章
相关标签/搜索