hadoop mapTask执行过程

基于2.7.1源码进行的分析 map端的执行执行的主要过程: 首先会对block进行split,每个split上启动一个map task,map方法执行完之后,最终会把输出写到磁盘上。如果没有热的侧阶段,则直接输出到hdfs上,如果有有reduce作业,则每个map方法的输出在写磁盘前线在内存中缓存。每个map task都有一个环状的内存缓冲区,存储着map的输出结果,在每次当缓冲区快满(默认是达
相关文章
相关标签/搜索