查询在A表不在B表的数据

时间 2019-11-06

标签查询不在数据繁體版

原文原文链接

假设有A、B两张表。sql

若是查询在A表中存在，可是在B表中不存在的记录，应该如何操做？code

假设A表数据：索引

B表数据：table

id	a_id
1	3

其中，B表中的a_id是须要排除的A表的id。效率

这里咱们要排除A表中id为3的记录，实际中可能有上万条记录。select

通常咱们首先想到的可能就是not in语句：搜索

select A.* from A where A.id not in(select B.a_id from B);

这样能够查询出正确的结果。遍历

可是若是B表很长，那么执行上述的查询语句，须要用A表中的字段去匹配B表中的每个字段。方法

至关因而A表的每个字段都要遍历一次B表，效率很是低下。数据

只要A中的字段不在B表中那么确定要遍历完B表，若是A表中的字段在B表中，那么只要遍历到就退出，进行A表中下一个字段的匹配。

链接查询使咱们平时进行sql查询用到最多的操做之一了。

相对于not in，使用链接查询的效率更高。

如下咱们分步骤解析用join方法的过程。

由于咱们须要搜索的是A表中的内容，因此第一步，咱们使用A表左链接B表，以下：

select * from A left join B on A.id = B.a_id;

这样B表中会补null，查询结果：

由于A、B两表中字段id相同，因此B表中的id字段变成了id1。

仔细观察能够发现，咱们须要的结果集[1, 2, 4, 5]所对应的id1字段都是null。

这样，在查询语句中加入条件B.id is null，不就能够完成对只在A表中，但不在B表中的结果集的查询。

另外，咱们只须要A表中的数据，B表的数据忽略。

因而最终变成：

select A.* from A left join B on A.id=B.a_id where B.id is null;

结果就是：

就是咱们须要的结果，在A表中，可是不在B表中的记录。

这样作还有一个好处，若是A、B表的id、和B表的a_id都加了索引，那么join方式就可以命中索引。

而若是是子查询，在MySQL5.6以前的版本，就不会用到A表的索引，查询效率大