试验了一下:
调整mapred-site.xml中mapred.min.split.size的值能够改变map的数量
首先设置了hdfs-site.xml中的dfs.block.size为20M,测试文件为72M
而后调整mapred-site.xml中mapred.min.split.size的值
30M 时候为 3个map
20M 时候为 4个map
10M 时候为 8个map 测试
也能够在程序中设置block.sizexml
conf.setInt("dfs.block.size",65536);it