12,maptask工作机制与maptask并行度与决定机制

1.准备数据 200MB 2.提交任务程序drive maptask通过inputformat读取,通过spilt切分了原文件,spilt=blocksize 3.mapper->map(k,v,context)->outputcollector 4.向环形缓冲区写入数据,默认大小为100MB,超过80%开始溢写 5.进行默认的分区排序 6.merge归并排序
相关文章
相关标签/搜索