Hadoop MapReduce作业的生命周期----Hadoop技术内幕学习笔记

2019独角兽企业重金招聘Python工程师标准>>> 1、作业提交与初始化。用户提交作业后,首先由JobClient实例将作业相关信息,比如将程序jar包、作业配置文件、分片元信息等上传到分布式文件系统,其中,分片元信息文件记录了每个输入分片的逻辑位置信息。然后JobClient通过RPC通知JobTracker。JobTracker收到新作业提交请求后,有作业调度模块对作业进行初始化:为作业创
相关文章
相关标签/搜索