MapReduce过程图解

1. 一个mr程序启动的时候,最先启动的是MRAppMaster,MRAppMaster启动后根据本次job的描述信息,计算出需要的maptask实例数量,然后向集群申请机器启动相应数量的maptask进程 2.maptask进程启动之后,根据给定的数据切片范围进行数据处理,主体流程为: a) 利用客户指定的inputformat来获取RecordReader读取数据,形成输入KV对 b) 将输入
相关文章
相关标签/搜索