Spark中的三种Join策略

介绍 Spark通常使用三种Join策略方式 Broadcast Hash Join(BHJ) Shuffle Hash Join(SHJ) Sort Merge Join(SMJ) Broadcast Hash Join 当小表与大表进行Join操作时,为了避免shuffle操作,将小表的所有数据分发到每个节点与大表进行Join操作,尽管牺牲了空间,但是避免了耗时的Shuffle操作。 表需要b
相关文章
相关标签/搜索