hadoop二次排序详解

1.定义 mapreduce计算过程当中的输出Key-Value,都是按key自动排序,此为一次排序。 若是既要按key做第一排序,同时把value做第二排序的方式,称为二次排序。 如图所示: 2.工做流程图(按value降序) 3.核心思想 将map端输出的java package com.tl.core.secondsort; import java.io.DataInput; import
相关文章
相关标签/搜索