hadoop-之二次排序&分组&分区

需求背景 MapReduce框架对处理结果的输出会根据key值进行默认的排序,这个默认排序能够知足一部分需求,可是也是十分有限的。在咱们实际的需求当中,每每有要对reduce输出结果进行二次排序的需求。对于二次排序的实现,本文将经过两个个实际的MapReduce二次排序例子,讲述二次排序的实现和其MapReduce的整个处理流程,而且经过结果和map、reduce端的日志来验证所描述的处理流程的正
相关文章
相关标签/搜索