sparksql的三种join实现

sparksql的三种join实现 引言 Join是SQL语句中的常用操作,良好的表结构能够将数据分散在不同的表中,使其符合某种范式,减少表冗余、更新容错等。而建立表和表之间关系的最佳方式就是Join操作。 对于Spark来说有3中Join的实现,每种Join对应着不同的应用场景: Broadcast Hash Join : 适合一张较小的表和一张大表进行join Shuffle Hash Joi
相关文章
相关标签/搜索