mapreduce的内部核心工作机制Shuffle-maptask生成的数据传输给reducetask的过程(fifteen day)

seven day second 学习了MapReduce的整体工作机制http://www.javashuo.com/article/p-rurnmgdo-sm.html 经过做了几个mapreduce练习,今儿再看看内部的核心工作机制(先学难的再回顾基础):   首先mapreduce是个分布式的,它的第一个工作进程叫maptask(真正的进程名字叫yarn child-->运行的逻辑叫map
相关文章
相关标签/搜索