mysql in，exists 优化

时间 2019-12-06

标签 mysql exists 优化栏目 MySQL 繁體版

原文原文链接

MySQL高级之 in和exists

in是把外表和内表做hash链接，而exists是对外表做loop循环，每次loop循环一次对内表进行一次查询。
若是查询的两个表大小至关，那么用in和exists差异不大；若是两个表中一个较小一个较大，则子查询表大的用exists，子查询表小的用in；mysql

注意： A表与B表的id字段应创建索引sql

select * from A where id in (select id from B) 
// in会使用子查询结果去主表匹配须要的行。子查询结果越大，去主表索引（A表上id列的索引）中检索的次数越多，效率越低

等价于:oop

for select id from B
for select * from A where A.id = B.id
// 好比：A表有5条记录，B表里有4万条记录，in会循环用4万个数据（id）去匹配这5条记录，成本远比用5条数据（id）去匹配4万条记录效率低

select * from A where exists (select 1 from B where B.id = A.id)
// exists是根据匹配项去判断是或者否，而后根据是否决定结果，子查询的表大，用exists判断，效率就会高

等价于性能

for select * from A
for select * from B where B.id = A.id
//好比：A表有5条记录，B表里有4万条记录，exists只进行5次判断，比in快不少。

结论：当A表的数据集小于B表的数据集时，用exists优于in。测试

select * from A where id in(select id from B)　//效率高

select * from A where exists(select cc from B where cc=A.id)　//效率低

结论：当B表的数据集小于A表的数据集时，用in优于exists。优化

not in 和not exists若是查询语句使用了not in 那么内外表都进行全表扫描，没有用到索引；而not extsts 的子查询依然能用到表上的索引。因此不管那个表大，用not exists都比not in要快。spa

网上还有人说mysql5.6版本对in查询作了很好的优化，因此效率问题要看具体的场景，要看真实测试的数据来进行优化！code

若是in和or所在列有索引或者主键的话，or和in没啥差异，执行计划和执行时间都几乎同样。索引

若是in和or所在列没有索引的话，性能差异就很大了。在没有索引的状况下，随着in或者or后面的数据量越多，in的效率不会有太大的降低，可是or会随着记录越多的话性能降低很是厉害。hash

所以在给in和or的效率下定义的时候，应该再加上一个条件，就是所在的列是否有索引或者是不是主键。若是有索引或者主键性能没啥差异，若是没有索引，性能差异不是一点点！