二十一、MapReduce工作流程介绍

一、流程示意图 如下图流程mr工作详细运行流程 步骤详细说明 1、获取待处理文件信息,得到文件大小,文件存储位置 2、根据切片参数,准备文件切片信息,如上假设按照默认块大小切片 0-128M 129-200M 两个数据片 3、切片完成有由客户端向yarn提交:job信息、split切片信息、jar包 4、Appmaster根据提交信息计算出开启几个Maptask,其实是由切片个数决定的,它实际决定
相关文章
相关标签/搜索