hadoop 的排序:key排序和分组排序

引入和说明 熟悉mapreduce执行流程的都知道,mapreduce流程中,一共有两类排序,第一种是对于key的排序,默认是是根据key的递增排序。第二种是对于reduce的组排序,将两条记录的key带入到 分组函数中,若是返回0,则说明两个记录是一组的,因此就把他们的value合到一个迭代器中,也就是reduce函数的第二个参数。java 最下面那个代码(小标题是整体代码)包括了 map ,r
相关文章
相关标签/搜索