大数据技术ReduceTask工作机制

1.ReduceTask工作机制 ReduceTask工作机制,如图4-19所示。     图4-19 ReduceTask工作机制 (1)Copy阶段:ReduceTask从各个MapTask上远程拷贝一片数据,并针对某一片数据,如果其大小超过一定阈值,则写到磁盘上,否则直接放到内存中。 (2)Merge阶段:在远程拷贝数据的同时,ReduceTask启动了两个后台线程对内存和磁盘上的文件进行合
相关文章
相关标签/搜索