MapReduce工作机制总结

总结从MapReduce程序中的JobClient.runJob(conf)开始,给出了MapReduce执行的流程图(如下),并分析了流程图中的四个核心实体,结合实际代码介绍了MapReduce执行的详细流程。 MapReduce的执行流程简单概括如下: 用户作业执行JobClient.runJob(conf)代码会在Hadoop集群上将其启动。 启动之后JobClient实例会向JobTrac
相关文章
相关标签/搜索