LEFT SEMI JOIN 是 IN/EXISTS 子查询的一种更高效的实现。code
Hive 当前没有实现 IN/EXISTS 子查询,因此你能够用 LEFT SEMI JOIN 重写你的子查询语句。LEFT SEMI JOIN 的限制是, JOIN 子句中右边的表只能在 查询
ON 子句中设置过滤条件,在 WHERE 子句、SELECT 子句或其余地方过滤都不行。co
SELECT a.key, a.value FROM a WHERE a.key in (SELECT b.key FROM B);
能够被重写为:
SELECT a.key, a.val FROM a LEFT SEMI JOIN b on (a.key = b.key)