大数据面试部分:部分面试题汇总

1. 一个数组快可以对应很多个,或者一个切片 一个split对应一个map 一个map对应一个或者n个reduce Map的输出正好是reduce的输入。 Shuffer:洗牌 数据向计算移动。 如何让shuffer的效率最高。 split一条一条,以一条记录为依据,也就是换行符。 映射成key -value的形式。 相同的key为一组。 面试的时候,buffer额调优,会是加分项。 有很多的机械
相关文章
相关标签/搜索