MapReduce运行流程和Yarn处理流程

1.首先从代码说起, MapTask类中有四个方法可以被重写,cleanup,map,run,setup setup的主要作用是加载一些资源,或者是在map阶段只需要一次运行的东西。 map主要负责处理数据 cleanup负责清理资源,释放资源 run负责调度这三个方法。 ReduceTask类中也类似。 2.MapReduce运行流程 可能文件的内容比较大,所以先将文件切割,这里就假设切割成两块
相关文章
相关标签/搜索