Spark 中几个 join 算子

Spark 中和 join 相关的算子有这几个:joinfullOuterJoinleftOuterJoinrightOuterJoinsql

这几种 join 算子和 sql 中的 join 相似,join 至关于内链接,fullOuterJoin 至关于全链接,leftOuterJoin 至关于左链接,rightOuterJoin 至关于右链接。spa

分别解释下这几种链接在 sql 中的含义,spark 中类推:code

  1. 内链接:若是表中有至少一个匹配,则返回行。
  2. 左链接:即便右表中没有匹配,也从左表返回全部的行。
  3. 右链接:即便左表中没有匹配,也从右表返回全部的行。
  4. 全链接:只要其中一个表中存在匹配,则返回行。

直观点看图:cdn

sql join 图解
相关文章
相关标签/搜索