Spark SQL Join类型

Spark SQL join工作是通过使用executors 操作DataFrame的多个分区,具体的过程和性能依赖join type和datasets的特征。join的过程中,包含了shuffle join 和broadcast join; 在两个大的datasets join的过程中,进行了 shuffle join,使左右的dataset的分区数据到达executors。如:        
相关文章
相关标签/搜索