Spark:shuffle过程详解

spark的shuffle有几种方式: 什么是shuffle Shuffle 过程本质上都是将 Map 端得到的数据使用分区器进行划分,并将数据发送给对应的 Reducer 的过程。web 前一个stage的ShuffleMapTask进行shuffle write,把数据存储在blockManager上面,而且把数据元信息上报到dirver的mapOutTarck组件中,下一个stage根据数据
相关文章
相关标签/搜索