Spark-Shuffle机制详解

Shuffle机制详解 什么是Shuffle? shuffle中文翻译为洗牌,需要shuffle的关键性原因是某种具有共同特征的数据需要最终汇聚到一个计算节点上进行计算。   发生在map方法之后,reduce方法之前。 Shuffle一般包含两阶段任务: 第一阶段:产生shuffle数据的阶段(map阶段)        补充:是ShuffleManager中的getWriter来写数据(数据可
相关文章
相关标签/搜索