hadoop_MR优化_Combiner和Join

Combiner 实现原理(个人理解):  溢写前的快速排序后或者归并排序后对数据进行一次合并(相当于一次reduce处理数据)  或者说在mapper和reducer之间多了一次reducer 代码实现方法:  1.添加一个实现类继承reducer<key,value,key,value>接口,前面的key,value是map的输出,后面的key,value是redece的输出,   2.然后重
相关文章
相关标签/搜索