Hadoop Mapreduce分区、分组、链接以及辅助排序(也叫二次排序)过程详解

一、MapReduce中数据流动    (1)最简单的过程:  map - reduce    (2)定制了partitioner以将map的结果送往指定reducer的过程: map - partition - reduce    (3)增长了在本地先进性一次reduce(优化)过程: map - combin(本地reduce) - partition -reduce 二、Mapreduce中
相关文章
相关标签/搜索