MYSQL中IN与EXISTS的区别

在MYSQL的连表查询中,最好是遵循‘小表驱动大表的原则’数据库

1、IN与EXISTS的区别
一、IN查询分析
SELECT   *  FROM A WHERE id IN (SELECT id FROM B);缓存

等价于:一、SELECT id FROM B ----->先执行in中的查询性能

              二、SELECT *  FROM A  WHERE A.id = B.id.net

以上in()中的查询只执行一次,它查询出B中的全部的id并缓存起来,而后检查A表中查询出的id在缓存中是否存在,若是存在则将A的查询数据加入到结果集中,直到遍历完A表中全部的结果集为止。blog

如下用遍历结果集的方式来分析IN查询内存

 

经过以上程序能够看出,当B表的数据较大时不适合使用in()查询,由于它会将B表中的数据所有遍历一次get

例如:table

一、A表中有100条记录,B表中有1000条记录,那么最多可能遍历100*1000次,效率不好效率

二、A表中有1000条记录,B表中有100条记录,那么最多可遍历1000*100此,内循环次数减小,效率大大提高循环

结论:IN()查询适合B表数据比A表数据小的状况,IN()查询是从缓存中取数据

二、EXISTS查询分析
语法:SELECT  字段 FROM  table WHERE EXISTS(subquery);

SELECT * FROM a WHERE EXISTS(SELECT 1 FROM b WHERE B.id  = A.id);

以上查询等价于:

一、SELECT * FROM A;

二、SELECT I FROM B WHERE B.id = A.id;

EXISTS()查询会执行SELECT * FROM A查询,执行A.length次,并不会将EXISTS()查询结果结果进行缓存,由于EXISTS()查询返回一个布尔值true或flase,它只在意EXISTS()的查询中是否有记录,与具体的结果集无关。

EXISTS()查询是将主查询的结果集放到子查询中作验证,根据验证结果是true或false来决定主查询数据结果是否得以保存。

如下用遍历结果集的方式来分析EXISTS查询

 

从以上程序能够看出:

当B表的数据比A表的数据大时适合使用EXISTS()查询,由于它不用遍历B操做,只执行一次查询就OK了

例如:

一、A表有100条记录,B表有1000条记录,那么EXISTS()会执行100次去判断A表中的id是否与B表中的id相等.由于它只执行A.length次,可见B表数据越多,越适合EXISTS()发挥效果.

二、A表有10000条记录,B表有100条记录,那么EXISTS()仍是执行10000次,此时不如使用in()遍历10000*100次,由于IN()是在内存里遍历数据进行比较,而EXISTS()须要查询数据库,咱们都知道查询数据库所消耗的性能更高,而内存比较很快.

三、结论:exists()适合B表比A表数据大的状况,当A表数据与B表数据同样大时,in与exists效率差很少,可任选一个使用

---------------------
原文:http://www.javashuo.com/article/p-yikdktup-hs.html

相关文章
相关标签/搜索