Hadoop Mapreduce分区、分组、二次排序过程详解[转]

原文地址:Hadoop Mapreduce分区、分组、二次排序过程详解[转] 做者: 徐海蛟 教学用途 一、MapReduce中数据流动    (1)最简单的过程:  map - reduce    (2)定制了partitioner以将map的结果送往指定reducer的过程: map - partition - reduce    (3)增长了在本地先进性一次reduce(优化)过程: map
相关文章
相关标签/搜索