Shuffle机制

完整地从map task端读取数据到reduce 端。 在跨节点读取数据时,尽可能地减少对带宽的不必要消耗。 减少磁盘IO对task执行的影响。   计算切片大小方法: FileInputFormat 类280行 切片公式   MapReduce 统计单词过程
相关文章
相关标签/搜索