MR自定义二次排序

在一个数据文件中,首先按照key排序。 在key相同的情况下,按照value大小排序的情况称为二次排序。 自定义key :NewKey实现比较规则 自定义GroupingComparator方法 在map阶段,使用job.setInputFormatClass定义的InputFormat将输入的数据集分割成小数据块splites,同时InputFormat提供一个RecordReder的实现。比如
相关文章
相关标签/搜索