MR处理数据内部流程图文字说明

1. 客户端有一个文件,读取文件(textInputFormat),生成新的的k v,开始一行一行的读取数据, 任务被读取之后,开始计算任务切片(就是Maptask个数,maptask的个数是根据文件的个数和文件的大小来决定的), 然后kv(k代表 行偏移量,v代表行内容)交给maptask(),之后kv不断地往maptask输入,kv交给map()方法,一个kv执行一次map方法,然后可以子啊m
相关文章
相关标签/搜索