hadoop-之二次排序&分组&分区

时间 2019-12-09

原文原文链接

需求背景 MapReduce框架对处理结果的输出会根据key值进行默认的排序，这个默认排序能够知足一部分需求，可是也是十分有限的。在咱们实际的需求当中，每每有要对reduce输出结果进行二次排序的需求。对于二次排序的实现，本文将经过两个个实际的MapReduce二次排序例子，讲述二次排序的实现和其MapReduce的整个处理流程，而且经过结果和map、reduce端的日志来验证所描述的处理流程的正