hadoop 的排序：key排序和分组排序

时间 2019-12-06

标签 hadoop 排序 key 分组栏目 Hadoop 繁體版

原文原文链接

引入和说明熟悉mapreduce执行流程的都知道，mapreduce流程中，一共有两类排序，第一种是对于key的排序，默认是是根据key的递增排序。第二种是对于reduce的组排序，将两条记录的key带入到分组函数中，若是返回0，则说明两个记录是一组的，因此就把他们的value合到一个迭代器中，也就是reduce函数的第二个参数。java 最下面那个代码（小标题是整体代码）包括了 map ，r

>>阅读原文<<