基本 SQL 之增删改查（二）

时间 2019-11-07

标签基本 sql 增删栏目 SQL 繁體版

原文原文链接

上一篇文章中，咱们介绍了 SQL 中最基本的 DML 语法，包括 insert 的插入数据、update 的更新数据、delete 的删除数据以及基本的查询语法，但大多比较简单不能解决咱们平常项目中复杂的需求。java

那么，本篇就来看一看较为复杂繁琐的查询语法，例如多表的链接查询、嵌套的子查询以及不少预约的功能函数。git

链接查询

关系型数据库的一个特色就是，多张表之间存在关系，以至于咱们能够链接多张表进行查询操做，因此链接查询会是关系型数据库中最多见的操做。程序员

链接查询主要分为三种，交叉链接、内链接和外链接，咱们一个个说。github

一、交叉链接数据库

交叉链接其实链接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：bash

若是你没学过数学中的笛卡尔积概念，你能够这样简单的理解这里的交叉链接：微信

两张表的交叉链接就是一个链接合并的过程，T1 表中的每一行会分别与 T2 表的每一行作一个组合链接并单独生成一行。例如 T1 的第一行会与 T2 的第一行合并生成一行，会与 T2 的第二行再合并生成一行，T2 的第三行合并生成一行，接着再以 T1 的第二行为基础重复上述动做。函数

应该不难理解，咱们看实现交叉链接的语法是什么样的。学习

交叉链接使用关键字 CROSS JOIN 进行链接，例如：ui

select * from table1 cross join table2
复制代码

也能够按照 ANSI SQL:1989 规范中指定的，使用逗号进行交叉链接，例如：

select * from table1,table2
复制代码

经过交叉链接，咱们能够两张表的数据进行一个结合，可是你会发现同时也产生了不少冗余的垃圾数据行，因此咱们每每也会结合 where 子句对结果集进行一个条件筛选。

例如咱们有这么两张表：

Students表：

+----+--------+------+----------+
| id | name   | age  | departId |
+----+--------+------+----------+
|  1 | 小明   |   12 |        1 |
|  2 | 胖虎   |   13 |        4 |
|  3 | 小新   |   15 |        2 |
|  4 | 曹操   | 1000 |        3 |
|  5 | 王安石 | 2000 |        5 |
|  6 | 杜甫   | 2000 |        2 |
+----+--------+------+----------+
复制代码

departs 表：

+----+----------------+
| id | depart         |
+----+----------------+
|  1 | 信息工程学院   |
|  2 | 文学院         |
|  3 | 化工学院       |
|  4 | 外国语学院     |
|  5 | 数学与统计学院 |
+----+----------------+
复制代码

若是咱们如今须要查询一个学生的学院信息，咱们就须要链接两个表，而咱们的交叉链接会为咱们产生太多冗余数据行，咱们可使用 where 子句对笛卡尔积后的结果集进行一个条件筛选。

select * from students,departs
where students.departId = departs.id
复制代码

这样就过滤了那些冗余的垃圾数据行，获得咱们须要的有效数据。

+----+--------+------+----------+----+----------------+
| id | name   | age  | departId | id | depart         |
+----+--------+------+----------+----+----------------+
|  1 | 小明   |   12 |        1 |  1 | 信息工程学院   |
|  3 | 小新   |   15 |        2 |  2 | 文学院         |
|  6 | 杜甫   | 2000 |        2 |  2 | 文学院         |
|  4 | 曹操   | 1000 |        3 |  3 | 化工学院       |
|  2 | 胖虎   |   13 |        4 |  4 | 外国语学院     |
|  5 | 王安石 | 2000 |        5 |  5 | 数学与统计学院 |
+----+--------+------+----------+----+----------------+
复制代码

可是咱们仍然须要说一下，虽然交叉链接容许结合 where 子句过滤冗余数据，可是笛卡尔积自己就形成了很大的资源消耗，对于这种状况，内链接会有更好效率体现，一样能实现该需求。

总归一句，笛卡尔积式的交叉链接谨慎使用。

二、内链接

内链接也能够理解为条件链接，它使用关键字 INNER JOIN 链接两张表并使用 ON 筛选器筛选组合合适的数据行。基本语法以下：

select * from table1 inner join table2 on [条件]

咱们一样以上述的 students 和 departs 表举例子，看这条 SQL：

select * from students
 inner join departs
 on students.departId = departs.id;
复制代码

会获得一样的结果：

+----+--------+------+----------+----+----------------+
| id | name   | age  | departId | id | depart         |
+----+--------+------+----------+----+----------------+
|  1 | 小明   |   12 |        1 |  1 | 信息工程学院   |
|  3 | 小新   |   15 |        2 |  2 | 文学院         |
|  6 | 杜甫   | 2000 |        2 |  2 | 文学院         |
|  4 | 曹操   | 1000 |        3 |  3 | 化工学院       |
|  2 | 胖虎   |   13 |        4 |  4 | 外国语学院     |
|  5 | 王安石 | 2000 |        5 |  5 | 数学与统计学院 |
+----+--------+------+----------+----+----------------+
复制代码

咱们也说了，虽然交叉链接也实现一样的效果，但实现原理是不一样的，效率也是不同的，交叉链接经过笛卡尔积返回结果集再结合 where 子句剔除冗余数据行，而内链接的 ON 筛选器工做在笛卡尔积过程当中，只有符合条件才能合并生成新的数据行。

这二者的效率是不一样的，内链接的效率显然是大于等于交叉链接的，因此咱们也建议了尽可能使用内链接取代交叉链接的使用。

三、外链接

咱们说内链接主要是两个步骤的结合，笛卡尔积加 ON 筛选器，通常状况下也是内链接使用的最为频繁。外链接实际上是基于内链接的两个步骤，额外新增了另外一个步骤，进一步苛刻化查询操做，咱们依然以上述的学生表和学院表营造这么一个场景：

咱们的学生表中保存了学生的我的信息以及所属的学院外键编号，假设其中有部分学生的学院还未分配，即为NULL。

那么我如今须要查询出全部的学生及其所属部门信息，包括那些未知学院信息的学生，请问你怎么作？

这个问题的核心点在于，我不只要知足链接条件成功合并的数据行，还要那些未成功匹配的行，也就是说学生表的全部行都得出现。

不卖关子了，使用左外链接便可实现：

咱们该一下 students 表中数据，departs 表中数据不变：

+----+------+------+----------+
| id | name | age  | departId |
+----+------+------+----------+
|  1 | 小明 |   12 |        1 |
|  2 | 胖虎 |   13 |     NULL |
|  3 | 小新 |   15 |        2 |
|  4 | 李白 |  200 |     NULL |
+----+------+------+----------+
复制代码

咱们执行 SQL ：

select * from
 students left outer join departs
 on students.departId = departs.id;
复制代码

获得结果：

+----+------+------+----------+------+--------------+
| id | name | age  | departId | id   | depart       |
+----+------+------+----------+------+--------------+
|  1 | 小明 |   12 |        1 |    1 | 信息工程学院 |
|  2 | 胖虎 |   13 |     NULL | NULL | NULL         |
|  3 | 小新 |   15 |        2 |    2 | 文学院       |
|  4 | 李白 |  200 |     NULL | NULL | NULL         |
+----+------+------+----------+------+--------------+
复制代码

你看，左链接至关于以左表为基准，成功链接匹配的就列出其对应的学院信息，不能匹配的就填充为 NULL。

固然，若是你想以右表为基准，你可使用右链接，关键词 right outer join/on。

除此以外，还有一种全外链接，这种模式下没有以谁为基准，两边表的全部行都得出现。咱们举个例子：

两边的表都在看，本身哪些行成功的条件匹配了，哪些没有，没有成功匹配的行会在最后强制出现，未匹配的字段赋值为 NULL。

这就是外链接的本质，但愿你理解了。

子查询

子查询，顾名思义就是嵌套的别的查询语句中的查询，由于不少时候查询不是一蹴而就的，每每是须要一个中间结果集做一个过渡的，而咱们的子查询就是用于这种中间结果集过渡。

一、出如今选择列表中

这种状况并很少见，但也是一种使用场景，能够应用在 insert，update，delete 和 select 语句中，咱们分别来看。

insert：

insert into students
 values(5,'yang',(select avg(id) from departs),1);
复制代码

咱们向 students 表中插入一条数据，age 字段的值为 departs 表 id 字段的平均值，这个例子自己没多大意义，可是我为你演示的是语法。

update：

update students set age=(select avg(id) from departs)
  where students.id = 1;
复制代码

记住，子查询必定要使用小括号括起来，强调一种优先级，否则会与外查询产生冲突报错。

delete：

delete from students
 where id = (select avg(id) from departs)
复制代码

select 语句的子查询相似，再也不赘述了。再次强调下，这种模式下使用子查询并很少见，不要刻意为了装逼写成这样，你会被打的！

二、含有in和exists的子查询

in 这个关键字相信你们也不陌生，咱们以前介绍 select 基本查询的时候介绍过，它强调的是一种集合的概念，能够视做一种逻辑运算符。

好比：

select * from students
  where id in(2,3,4,5,6)
复制代码

咱们换成子查询就变成：

select * from students
  where id in(select id from departs)
复制代码

这时的子查询返回的是一个集合，而再也不是一个常量。

exists 带来的子查询主要思路：将主查询的数据，放到子查询中作条件验证，根据验证结果（TRUE 或 FALSE）来决定主查询的数据结果是否得以保留。

只要子查询有返回行，即返回 true，不然返回 false。

基本语法以下：

select [select_list] from [table]
where [not] exists [子查询]
复制代码

看起来挺复杂，咱们举个例子你就明白了：

以咱们的学生表来讲，每一个学生都存储了一个学院字段信息，经过这个字段的值能够具体查到学院的名字，那么假如现学生表中有大量陈腐数据，无效或为空的学院 id 对应的数据都是有些有问题的数据，现须要查出这些数据

departs 表以下：

+----+----------------+
| id | depart         |
+----+----------------+
|  1 | 信息工程学院   |
|  2 | 文学院         |
|  3 | 化工学院       |
|  4 | 外国语学院     |
|  5 | 数学与统计学院 |
+----+----------------+
复制代码

students 表以下：

+----+------+------+----------+
| id | name | age  | departId |
+----+------+------+----------+
|  1 | 小明 |   12 |        1 |
|  2 | 小红 |   13 |        2 |
|  3 | 王菲 |   14 |       10 |
|  4 | 张三 |   23 |     NULL |
+----+------+------+----------+
复制代码

显然，学生表中的第三第四行数据有问题，他们的学院 id 非法，咱们须要使用 SQL 找到这两条数据。

select * from students
where not exists
(select * from departs where students.departId = departs.id)
复制代码

执行 SQL，看看结果：

+----+------+------+----------+
| id | name | age  | departId |
+----+------+------+----------+
|  3 | 王菲 |   14 |       10 |
|  4 | 张三 |   23 |     NULL |
+----+------+------+----------+
复制代码

首先外查询拿到 students 表的全部数据，where 子句会遍历每一行，执行子查询过滤筛选，若是整个 where 子句返回为 true，表明该行记录有效应该被查询出来，不然将抛弃该行，继续遍历。

关于子查询暂时句介绍到这，基本核心的内容都已经附带例子的介绍了，什么嵌套子查询不过是多套了一层而已，相信你可以理解，这里再也不赘述了。

经常使用函数

SQL 规范中定义了不少的函数方法，它们按照应用场景不一样能够划分为如下类别，聚合函数、日期时间函数、字符串函数，逻辑函数等等，咱们抽取几个较为频繁使用的方法介绍下，其他的留待你们自行研究。

聚合函数：

AVG(column_name)：求取结果集某一列的平均值，若是某条记录行该字段NULL，将不参与平均值计算
COUNT(column_name)：统计结果集中数据记录行数，即统计有多少条数据
MAX(column_name)：返回结果集中某列的最大值
SUM(colunmn_name)：求和结果集某列
MIN(column_name)：返回结果集中某列的最小值
除此以外，还有一些求标准差，方差

聚合函数的一个特色是，它每每是对整个结果集进行了某种数学运算并返回一个常量数值而非集合。

日期时间函数：

因为日期函数在不一样的数据实现来讲，不少相同功能的函数具备不一样的函数名称，咱们这里仅以 MySql 来介绍这些函数，给你一个宏观印象，不一样的数据库之间只不过语法差别，搜索引擎就能够解决。

NOW()：返回当前日期时间，精确到时分秒
CURDATE()：返回当前的日期
CURTIME()：返回当前的时间
DATA(日期时间/日期表达式)：该函数用于提取参数中的日期部分，参数可为一个时分秒的日期对象，或字符串表达式
EXTRACT(unit FROM date)：取出日期时间中指定部分，unit 可取值年、月、日、时分秒等等
DATE_ADD(date,INTERVAL expr type)：为指定参数的时间日期添加一个时间间隔
DATEDIFF(date1,date2)：返回两个日期时间之间相隔的天数
DATE_FORMAT(date,format)：按照指定格式输出指定的日期时间

咱们详细说一下最后一个函数，这个函数用于格式化输出一个日期时间对象，format 为指定的格式，取值以下：

举个例子：

select date_format(now(),'年:%Y-月:%m-日:%d');

执行 SQL，将输出：

年:2019-月:02-日:25

虽然很奇怪的输出格式，但我要说明的是这种可定制化的日期格式输出函数。

数学函数：

ABS(column_name)：求绝对值
PI()：返回常量 3.141593
还有一些正弦、余弦，正切，平方根等函数

除此以外，还有不少函数，例如一些操做字符串、文本等等函数，这里不一一赘述了，用到的时候尝试性的搜一搜，看有没有预约义的函数可以解决你的当下需求。

那么，繁杂的一篇又结束了，自认为干货仍是很足的，着重讲了比较重要的链接查询和子查询，不知道你有啥想法呢，欢迎你和我讨论！

关注公众不迷路，一个爱分享的程序员。 公众号回复「1024」加做者微信一块儿探讨学习！ 每篇文章用到的全部案例代码素材都会上传我我的 github github.com/SingleYam/o… 欢迎来踩！