hdfs-mapreduce处理流程(二)

1、问题:在这张图中有几个工人,几个工厂 工人: 4 --map处理程序 厂: 3 --reduce相当于最后的工厂 组装 2、map端进行了什么事:砍树这一步叫做split 过程 砍树—把我们hdfs的文件进行切割(砍树) ----- 默认与block块的大小一 致(128M) split=block=maptask 2.1当然为了更好的处理,在计算资源充足的情况下,把split变大设置为256
相关文章
相关标签/搜索