in是把外表和内表做hash链接,而exists是对外表做loop循环,每次loop循环一次对内表进行一次查询。
若是查询的两个表大小至关,那么用in和exists差异不大;若是两个表中一个较小一个较大,则子查询表大的用exists,子查询表小的用in;mysql
注意: A表与B表的id字段应创建索引sql
select * from A where id in (select id from B) // in会使用子查询结果去主表匹配须要的行。子查询结果越大,去主表索引(A表上id列的索引)中检索的次数越多,效率越低
等价于:oop
for select id from B for select * from A where A.id = B.id // 好比:A表有5条记录,B表里有4万条记录,in会循环用4万个数据(id)去匹配这5条记录,成本远比用5条数据(id)去匹配4万条记录效率低
select * from A where exists (select 1 from B where B.id = A.id) // exists是根据匹配项去判断是或者否,而后根据是否决定结果,子查询的表大,用exists判断,效率就会高
等价于性能
for select * from A for select * from B where B.id = A.id //好比:A表有5条记录,B表里有4万条记录,exists只进行5次判断,比in快不少。
结论:当A表的数据集小于B表的数据集时,用exists优于in。测试
select * from A where id in(select id from B) //效率高 select * from A where exists(select cc from B where cc=A.id) //效率低
结论:当B表的数据集小于A表的数据集时,用in优于exists。优化
not in 和not exists若是查询语句使用了not in 那么内外表都进行全表扫描,没有用到索引;而not extsts 的子查询依然能用到表上的索引。因此不管那个表大,用not exists都比not in要快。spa
网上还有人说mysql5.6版本对in查询作了很好的优化,因此效率问题要看具体的场景,要看真实测试的数据来进行优化!code
若是in和or所在列有索引或者主键的话,or和in没啥差异,执行计划和执行时间都几乎同样。索引
若是in和or所在列没有索引的话,性能差异就很大了。在没有索引的状况下,随着in或者or后面的数据量越多,in的效率不会有太大的降低,可是or会随着记录越多的话性能降低很是厉害。hash
所以在给in和or的效率下定义的时候,应该再加上一个条件,就是所在的列是否有索引或者是不是主键。若是有索引或者主键性能没啥差异,若是没有索引,性能差异不是一点点!