hadoop相关试题总结

1.MapTask并行机度是由什么决定的?java 由切片数量决定的。node 3.combiner和partition的做用:linux combiner的意义就是对每个maptask的输出进行局部汇总,以减少网络传输量  partition的默认实现是hashpartition,是map端将数据按照reduce个数取余,进行分区,不一样的reduce来copy本身的数据。 partition的
相关文章
相关标签/搜索