【大数据面试题】(一)Hadoop 相关面试题总结

1.MapTask并行机度是由什么决定的? 由切片数量决定的。 2.MR是干什么的? MR将用户编写的业务逻辑代码和自带的默认组件结合起来组成一个完整的分布式应用程序放到hadoop集群上运行。 3.combiner和partition的作用: combiner的意义就是对每一个maptask的输出进行局部汇总,以减小网络传输量  partition的默认实现是hashpartition,是map
相关文章
相关标签/搜索