Spark的Shuffle之BypassMergeSortShuffleWriter

    来介绍一下最后一种Shuffle的方式ByPassMergeSortShuffleWriter,它和已经废弃的HashShuffleWriter类似,区别在于map端的多个文件会被汇总成一个文件,这样就大大减少了磁盘IO的压力。   ByPassMergeSortShuffleWriter流程示例如下: 使用这种Shuffle方式需要满足两个条件: 没有定义mapSideCombine(m
相关文章
相关标签/搜索