MySQL里面的子查询

时间 2019-12-14

标签 mysql 里面查询栏目 MySQL 繁體版

原文原文链接

1、子查询定义

　　定义：mysql

　　子查询容许把一个查询嵌套在另外一个查询当中。sql

　　子查询，又叫内部查询，相对于内部查询，包含内部查询的就称为外部查询。数据库

　　子查询能够包含普通select能够包括的任何子句，好比：distinct、 group by、order by、limit、join和union等；可是对应的外部查询必须是如下语句之一：select、insert、update、delete、set或者do。express

　　子查询的位置：
　　　　select 中、from 后、where 中.group by 和order by 中无实用意义。函数

2、子查询分类

　　子查询分为以下几类：
　　　　1. 标量子查询：返回单一值的标量，最简单的形式。
　　　　2. 列子查询：返回的结果集是 N 行一列。
　　　　3. 行子查询：返回的结果集是一行 N 列。
　　　　4. 表子查询：返回的结果集是 N 行 N 列。
　　可使用的操做符：= > < >= <= <> ANY IN SOME ALL EXISTS post

　　一个子查询会返回一个标量（就一个值）、一个行、一个列或一个表，这些子查询称之为标量、行、列和表子查询。性能

　　若是子查询返回一个标量值（就一个值），那么外部查询就可使用：=、>、<、>=、<=和<>符号进行比较判断；若是子查询返回的不是一个标量值，而外部查询使用了比较符和子查询的结果进行了比较，那么就会抛出异常。优化

　　1. 标量子查询：ui

　　　　是指子查询返回的是单一值的标量，如一个数字或一个字符串，也是子查询中最简单的返回形式。可使用 = > < >= <= <> 这些操做符对子查询的标量结果进行比较，一般子查询的位置在比较式的右侧
　　　　示例：　　spa

 
           SELECT * FROM article WHERE uid = (SELECT uid FROM user WHERE status=1 ORDER BY uid DESC LIMIT 1) 
          
           SELECT * FROM t1 WHERE column1 = (SELECT MAX(column2) FROM t2) 
          
           SELECT * FROM article AS t WHERE 2 = (SELECT COUNT(*) FROM article WHERE article.uid = t.uid)

　　2. MySQL 列子查询：

　　　　指子查询返回的结果集是 N 行一列，该结果一般来自对表的某个字段查询返回。
　　　　可使用 = > < >= <= <> 这些操做符对子查询的标量结果进行比较，一般子查询的位置在比较式的右侧
　　　　可使用 IN、ANY、SOME 和 ALL 操做符，不能直接使用 = > < >= <= <> 这些比较标量结果的操做符。
　　　　示例：

 
           SELECT * FROM article WHERE uid IN(SELECT uid FROM user WHERE status=1) 
          
           SELECT s1 FROM table1 WHERE s1 > ANY (SELECT s2 FROM table2) 
          
           SELECT s1 FROM table1 WHERE s1 > ALL (SELECT s2 FROM table2)

　　　　NOT IN 是 <> ALL 的别名，两者相同。
　　　　特殊状况
　　　　　　若是 table2 为空表，则 ALL 后的结果为 TRUE；
　　　　　　若是子查询返回如 (0,NULL,1) 这种尽管 s1 比返回结果都大，但有空行的结果，则 ALL 后的结果为 UNKNOWN 。
　　　　注意：对于 table2 空表的状况，下面的语句均返回 NULL：

 
           SELECT s1 FROM table1 WHERE s1 > (SELECT s2 FROM table2) 
          
           SELECT s1 FROM table1 WHERE s1 > ALL (SELECT MAX(s1) FROM table2)

　　3. MySQL 行子查询：

　　　　指子查询返回的结果集是一行 N 列，该子查询的结果一般是对表的某行数据进行查询而返回的结果集。
　　　　例子：

 
           SELECT * FROM table1 WHERE (1,2) = (SELECT column1, column2 FROM table2) 
          
           注：(1,2) 等同于 row(1,2) 
          
           SELECT * FROM article WHERE (title,content,uid) = (SELECT title,content,uid FROM blog WHERE bid=2)

　　4. MySQL 表子查询：

　　　　指子查询返回的结果集是 N 行 N 列的一个表数据。
　　　　例子：

 
           SELECT * FROM article WHERE (title,content,uid) IN (SELECT title,content,uid FROM blog)

3、字查询例举

　　1. ANY进行子查询

　　any关键词的意思是“对于子查询返回的列中的任何一个数值，若是比较结果为TRUE，就返回TRUE”。

　　比如“10 >any(11, 20, 2, 30)”，因为10>2，因此，该该判断会返回TRUE；只要10与集合中的任意一个进行比较，获得TRUE时，就会返回TRUE。　　

 
           select  
           table1.customer_id,city,count(order_id) 
          
           from  
           table1  
           join  
           table2 
          
           on  
           table1.customer_id=table2.customer_id 
          
           where  
           table1.customer_id<> 
           'tx'  
           and table1.customer_id<> 
           '9you' 
          
           group  
           by  
           customer_id 
          
           having count(order_id) > 
          
           any ( 
          
           select  
           count(order_id) 
          
           from  
           table2 
          
           where  
           customer_id= 
           'tx'  
           or customer_id= 
           '9you' 
          
           group  
           by  
           customer_id);

　　any的意思比较好明白，直译就是任意一个，只要条件知足任意的一个，就返回TRUE。

　　2. 使用IN进行子查询

　　使用in进行子查询，这个咱们在平常写sql的时候是常常遇到的。in的意思就是指定的一个值是否在这个集合中，如何在就返回TRUE；不然就返回FALSE了。

　　in是“=any”的别名，在使用“=any”的地方，咱们均可以使用“in”来进行替换。

　　有了in，确定就有了not in；not in并非和<>any是一样的意思，not in和<>all是一个意思。

　　3. 使用SOME进行子查询

　　some是any的别名，用的比较少。
　　

　　4. 使用ALL进行子查询

　　all必须与比较操做符一块儿使用。all的意思是“对于子查询返回的列中的全部值，若是比较结果为TRUE，则返回TRUE”。

　　比如“10 >all(2, 4, 5, 1)”，因为10大于集合中的全部值，因此这条判断就返回TRUE；而若是为“10 >all(20, 3, 2, 1, 4)”，这样的话，因为10小于20，因此该判断就会返回FALSE。

　　<>all的同义词是not in，表示不等于集合中的全部值，这个很容易和<>any搞混，平时多留点心就行了。

　　5.标量子查询

　　根据子查询返回值的数量，将子查询能够分为标量子查询和多值子查询。在使用比较符进行子查询时，就要求必须是标量子查询；若是是多值子查询时，使用比较符，就会抛出异常。

　　6. 多值子查询

　　与标量子查询对应的就是多值子查询了，多值子查询会返回一列、一行或者一个表，它们组成一个集合。咱们通常使用的any、in、all和some等词，将外部查询与子查询的结果进行判断。若是将any、in、all和some等词与标量子查询，就会获得空的结果。

　　7. 独立子查询

　　独立子查询是不依赖外部查询而运行的子查询。什么叫依赖外部查询？先看下面两个sql语句。

　　sql语句1：得到全部hangzhou顾客的订单号。　

 
           select  
           order_id  
          
           from  
           table2  
          
           where  
           customer_id  
           in 
          
           ( 
           select  
           customer_id  
          
           from  
           table1  
          
           where  
           city= 
           'hangzhou' 
           );

　　sql语句2：得到城市为hangzhou，而且存在订单的用户。

 
           select  
           *  
          
           from  
           table1  
          
           where  
           city= 
           'hangzhou'  
           and exists 
          
           ( 
           select  
           *  
          
           from  
           table2  
          
           where  
           table1.customer_id=table2.customer_id);

　　上面的两条sql语句，虽然例子举的有点不是很恰当，可是足以说明这里的问题了。

　　　　对于sql语句1，咱们将子查询单独复制出来，也是能够单独执行的，就是子查询与外部查询没有任何关系。

　　　　对于sql语句2，咱们将子查询单独复制出来，就没法单独执行了，因为sql语句2的子查询依赖外部查询的某些字段，这就致使子查询就依赖外部查询，就产生了相关性。

　　对于子查询，不少时候都会考虑到效率的问题。当咱们执行一个select语句时，能够加上explain关键字，用来查看查询类型，查询时使用的索引以及其它等等信息。好比这么用：

 
           explain  
           select  
           order_id  
          
           from  
           table2  
          
           where  
           customer_id  
           in 
          
           ( 
           select  
           customer_id  
          
           from  
           table1  
          
           where  
           city= 
           'hangzhou' 
           );

　　使用独立子查询，若是子查询部分对集合的最大遍历次数为n，外部查询的最大遍历次数为m时，咱们能够记为：O(m+n)。而若是使用相关子查询，它的遍历次数可能会达到O(m+m*n)。能够看到，效率就会成倍的降低；因此，大伙在使用子查询时，必定要考虑到子查询的相关性。

　　8.相关子查询

　　相关子查询是指引用了外部查询列的子查询，即子查询会对外部查询的每行进行一次计算。可是在MySQL的内部，会进行动态优化，会随着状况的不一样会有所不一样。使用相关子查询是最容易出现性能的地方。而关于sql语句的优化，这又是一个很是大的话题了，只能经过实际的经验积累，才能更好的去理解如何进行优化。

　　9.EXISTS谓词

　　EXISTS是一个很是牛叉的谓词，它容许数据库高效地检查指定查询是否产生某些行。根据子查询是否返回行，该谓词返回TRUE或FALSE。与其它谓词和逻辑表达式不一样的是，不管输入子查询是否返回行，EXISTS都不会返回UNKNOWN，对于EXISTS来讲，UNKNOWN就是FALSE。仍是上面的语句，得到城市为hangzhou，而且存在订单的用户。

 
           select  
           *  
          
           from  
           table1  
          
           where  
           city= 
           'hangzhou'  
           and exists 
          
           ( 
           select  
           *  
          
           from  
           table2  
          
           where  
           table1.customer_id=table2.customer_id);

　　关于IN和EXISTS的主要区别在于三值逻辑的判断上。EXISTS老是返回TRUE或FALSE，而对于IN，除了TRUE、FALSE值外，还有可能对NULL值返回UNKNOWN。可是在过滤器中，UNKNOWN的处理方式与FALSE相同，所以使用IN与使用EXISTS同样，SQL优化器会选择相同的执行计划。

　　说到了IN和EXISTS几乎是同样的，可是，就不得不说到NOT IN和NOT EXISTS，对于输入列表中包含NULL值时，NOT EXISTS和NOT IN之间的差别就表现的很是大了。输入列表包含NULL值时，IN老是返回TRUE和UNKNOWN，所以NOT IN就会获得NOT TRUE和NOT UNKNOWN，即FALSE和UNKNOWN。

　　10. 派生表

　　上面也说到了，在子查询返回的值中，也可能返回一个表，若是将子查询返回的虚拟表再次做为FROM子句的输入时，这就子查询的虚拟表就成为了一个派生表。语法结构以下：

 
           FROM (subquery expression) AS derived_table_alias

　　因为派生表是彻底的虚拟表，并无也不可能被物理地具体化。

4、子查询优化

　　不少查询中须要使用子查询。使用子查询能够一次性的完成不少逻辑上须要多个步骤才能完成的SQL操做，同时也能够避免事务或者表锁死。子查询可使查询语句很灵活，但子查询的执行效率不高。

　　子查询时，MySQL须要为内层查询语句的查询结果创建一个临时表。而后外层查询语句再临时表中查询记录。查询完毕后，MySQL须要撤销这些临时表。所以，子查询的速度会受到必定的影响。若是查询的数据量比较大，这种影响就会随之增大。

　　在MySQL中可使用链接查询来替代子查询。链接查询不须要创建临时表，其速度比子查询要快。

　　　　使用链接(JOIN)来代替子查询
　　　　如：　　

 
           例子1： 
          
           SELECT * FROM t1 
          
           WHERE t1.a1 NOT  
           in  
           (SELECT a2 FROM t2 )  
          
           优化后： 
          
           SELECT * FROM t1  
          
           LEFT JOIN t2 ON t1.a1=t2.a2  
          
           WHERE t2.a2 IS NULL

 
           例子2： 
          
           SELECT * FROM article WHERE (title,content,uid) IN (SELECT title,content,uid FROM blog) 
          
           优化后： 
          
           SELECT * FROM article 
          
           inner  
           join  
           blog  
          
           on  
           (article.title=blog.title AND article.content=blog.content AND article.uid=blog.uid)

　　不能优化的子查询：　　一、mysql不支持子查询合并和聚合函数子查询优化，mariadb对聚合函数子查询进行物化优化；　　二、mysql不支持from子句子查询优化，mariadb对from子句子查询进行子查询上拉优化；　　三、mysql和mariadb对子查询展开提供有限的支持，如对主键的操做才能进行上拉子查询优化；　　四、mysql不支持exists子查询优化，mariadb对exists关联子查询进行半链接优化，对exists非关联子查询没有进一步进行优化；　　五、mysql和mariadb不支持not exists子查询优化；　　六、mysql和mariadb对in子查询，对知足半链接语义的查询进行半链接优化，再基于代价评估进行优化，二者对半链接的代价评估选择方式有差别；　　七、mysql不支持not in子查询优化，mariadb对非关联not in子查询使用物化优化，对关联not in子查询不作优化；　　八、mysql和mariadb对>all非关联子查询使用max函数，<all非关联子查询使用min函数，对=all和非关联子查询使用exists优化；　　九、对>some和>any非关联子查询使用min函数，对<some和<any非关联子查询使用max函数，=any 和=some子查询使用半链接进行优化，对>some和>any关联子查询以及<some和<any关联子查询只有exists 优化。