大数据技术之Hadoop(MapReduce)第3章 MapReduce框架原理

3.1 MapReduce工作流程 1)流程示意图 2)流程详解 上面的流程是整个mapreduce最全工作流程,但是shuffle过程只是从第7步开始到第16步结束,具体shuffle过程详解,如下: 1)maptask收集我们的map()方法输出的kv对,放到内存缓冲区中 2)从内存缓冲区不断溢出本地磁盘文件,可能会溢出多个文件 3)多个溢出文件会被合并成大的溢出文件 4)在溢出过程中,及合并
相关文章
相关标签/搜索