假设有A、B两张表。sql
若是查询在A表中存在,可是在B表中不存在的记录,应该如何操做?code
假设A表数据:索引
id |
---|
1 |
2 |
3 |
4 |
5 |
B表数据:table
id | a_id |
---|---|
1 | 3 |
其中,B表中的a_id是须要排除的A表的id。效率
这里咱们要排除A表中id为3的记录,实际中可能有上万条记录。select
通常咱们首先想到的可能就是not in语句:搜索
select A.* from A where A.id not in(select B.a_id from B);
这样能够查询出正确的结果。遍历
可是若是B表很长,那么执行上述的查询语句,须要用A表中的字段去匹配B表中的每个字段。方法
至关因而A表的每个字段都要遍历一次B表,效率很是低下。数据
只要A中的字段不在B表中那么确定要遍历完B表,若是A表中的字段在B表中,那么只要遍历到就退出,进行A表中下一个字段的匹配。
链接查询使咱们平时进行sql查询用到最多的操做之一了。
相对于not in,使用链接查询的效率更高。
如下咱们分步骤解析用join方法的过程。
由于咱们须要搜索的是A表中的内容,因此第一步,咱们使用A表左链接B表,以下:
select * from A left join B on A.id = B.a_id;
这样B表中会补null,查询结果:
id | id1 | a_id |
---|---|---|
1 | NULL | NULL |
2 | NULL | NULL |
3 | 1 | 3 |
4 | NULL | NULL |
5 | NULL | NULL |
由于A、B两表中字段id相同,因此B表中的id字段变成了id1。
仔细观察能够发现,咱们须要的结果集[1, 2, 4, 5]所对应的id1字段都是null。
这样,在查询语句中加入条件B.id is null,不就能够完成对只在A表中,但不在B表中的结果集的查询。
另外,咱们只须要A表中的数据,B表的数据忽略。
因而最终变成:
select A.* from A left join B on A.id=B.a_id where B.id is null;
结果就是:
id |
---|
1 |
2 |
4 |
5 |
就是咱们须要的结果,在A表中,可是不在B表中的记录。
这样作还有一个好处,若是A、B表的id、和B表的a_id都加了索引,那么join方式就可以命中索引。
而若是是子查询,在MySQL5.6以前的版本,就不会用到A表的索引,查询效率大