MapReduce中的map,shuffle、partition和combiner,reduce的含义及作用

Hadoop的计算框架主要是两个过程分别是map和reduce,但是还有好几个过程跟性能调优有关。如:shuffle、partition和combiner。 shuffle:数据从map端传输到reduce端的过程。据说是可以期待奇迹发生的环节。 计算框架总体的过程如下: map阶段:从磁盘读入数据 --> map函数 --> combine结果(非必需的过程)--> 结果写回磁盘。 map阶段中
相关文章
相关标签/搜索