MapReduce框架原理之MapTask工作机制

  一、MapTask并行度决定机制 maptask并行度决定map阶段任务处理的并发度,进而影响整个job的处理速度。 一个job的map阶段MapTask并行度(个数),由客户端提交job时的切片个数决定。 例如,切两个切片,就会生成两个map task,切3个切片,就会生成3个map task。如图所示:   二、MapTask工作机制 MapTask工作机制如图所示: (1)Read阶段:
相关文章
相关标签/搜索