Hadoop入门之Mapreduce部分流程解析

1.建立连接后,任务文件的分片 (1)客户端和resourcemanager建立连接后需要提交一些文件来构建Job任务,分片的文件是其中之一,还有Job.xml 和Jar (2)分片主要的作用是为后面的Maptask过程确定启动多少个maptask及其所要处理的文件的划分(默认以文件或者blackSzie划分) (3)具体分片数量的确定在  org.apache.hadoop.mapreduce.
相关文章
相关标签/搜索