Spark的join什么情况下可以避免shuffle?

Spark的join操作可能触发shuffle操作。shuffle操作要经过磁盘IO,网络传输,对性能影响比较大。本文聊一聊Spark的join在哪些情况下可以避免shuffle过程。 1 DataFrame/Dataset的join如何避免shuffle 针对Spark DataFrame/DataSet的join,可以通过broadcast join和bucket join来避免shuffle
相关文章
相关标签/搜索