Hadoop的MapReduce之maptask和reducetask

mapreduce就是一个分布式程序的通用框架:一个完整的mapreduce程序在分布式运行时有三类实例进程:(根据hadoop2.0以后版本进行讲述) 1、MRAppMaster:负责整个程序的过程调度及状态协调; 2、mapTask:负责map阶段的整个数据处理流程; 3、ReduceTask:负责reduce阶段的整个数据处理流程; 具体流程解析如下: 1. 一个MapReduce程序启动的
相关文章
相关标签/搜索