快速回顾MySQL：汇总和分组

时间 2020-01-18

标签快速回顾 mysql 汇总分组栏目 MySQL 繁體版

原文原文链接

10.3 汇总数据

咱们常常须要汇总数据而不用把它们实际检索处出来，为此MySQL提供了专门的函数。使用这些函数，MySQL查询可用于检索数据，以便分析和报表的生成。这种类型的检索例子有如下几种：express

肯定表中的行数（或者知足某个条件或包含某个特定值的行数）。
得到表中行组的和。
找出表列（或全部行或某些特定的行）的最大值、最小值和平均值。

上述的例子都须要对表中数据（而不是实际数据自己）汇总。所以，返回实际表数据是对时间和处理资源的一种浪费（更不用说带宽了）。函数

MySQL提供了5个汇集函数。学习

汇集函数（aggregate function）运行在行组上，计算和返回单个值的函数。设计

函数	说明
AVG()	返回某列的平均值
COUNT()	返回某列的行数
MAX()	返回某列的最大值
MIN()	返回某列的最小值
SUM()	返回某列值之和

下面简单介绍这些函数code

先建立下面的表：排序

CREATE TABLE student(
    sid INT PRIMARY KEY,
    sname VARCHAR(20),
    ssex  CAHR(1)
);
CREATE TABLE score(
    sid INT PRIMARY KEY,
    sname VARCHAR(20),
    smath INT,
    senglish INT
);

10.3.1 AVG()函数

AVG()经过对表中行数计数并计算特定列值之和，求得该列的平均值。AVG()可用来返回全部列的平均值，也能够用来返回特定列平均值。资源

AVG()只能用来肯定特定数值列的平均值，并且列名必须做为函数参数给出。为了得到多个列的平均值，必须使用多个AVG()函数。
AVG()函数忽略列值为NULL的行。数学

来使用AVG()函数来查询成绩表score中数学成绩的平均分（本身随便加上几个数）：io

SELECT AVG(smath) AS avg_smath FROM score;

AVG()也可用用来肯定特定列平均值，配合WHERE子句。table

10.3.2 COUNT()函数

COUNT()函数肯定表中行的数目或符合特定条件的行的数目。

COUNT()函数有两种使用的方式：

使用COUNT(*)对表中行的数目进行计数，无论表列中包含的是空值（NULL）仍是非空值。
使用COUNT(column)对特定列中具备值的行进行计数，忽略NULL值。

好比：返回学生总数：

SELECT COUNT(*) FROM student;

返回女生总数（特定列）：

SELECT COUNT(ssex) FROM student WHERE ssex='女';

若是指定列名，则指定列的值为空的行被COUNT()函数忽略，但若是COUNT()函数中用的是星号（*），则不忽略。

10.3.3 MAX()函数

MAX() 返回指定列中的最大值。MAX() 要求指定列名。

好比：返回成绩表中数学成绩的最高分：

SELECT MAX(smath) FROM score;

虽然MAX()通常用来找出最大的数值或日期值，但MySQL容许将它用来返回任意列中的最大值，包括返回文本列中的最大值。在用于文本数据时，若是数据按相应的列排序，则MAX()返回最后一行。MIN()函数也是，可是相反，返回最前面的行。

MAX()、MIN()都是忽略列值为NULL的行。

10.3.4 MIN()函数

MIN() 返回指定列中的最小值。MIN() 要求指定列名。

好比：返回成绩表中数学成绩的最低分：

SELECT MIN(smath) FROM score;

10.3.5 SUM()函数

SUM()用来返回指定列值的和（总计）。

好比返回一个班中的数学成绩的总分：

SELECT SUM(smath) FROM score;

利用标准的算术操做符，全部的汇集函数均可以用来执行多个列上的计算。

SUM()函数忽略列值为NULL的行。

10.3.6 汇集不一样值

以上5个汇集函数均可以以下使用：

对全部的行执行计算，指定参数或不给参数（MAX和MIN函数）；
只包含不一样的值，指定DISTINCT参数。（去重）

下面举例指定DISTINCT参数的用法：好比成绩表中数学成绩的平均分，平均分只考虑各个不一样的分数：

SELECT AVG(DISTINCT smath) AS avg_smath FROM score;

若是指定列名，则DISTINCT只能用于COUNT()，DISTINCT不能用于COUNT(*)，所以不容许使用COUNT(DISTINCT)，不然会产生错误。相似地，DISTINCT必须使用列名，不能用于计算或表达式。

DISTINCT可用于MAX()和MIN()，可是没有意义。

10.3.7 组合汇集函数

实际上SELECT语句可根据须要包含多个汇集函数。

使用汇集函数，最好使用别名。

小结：汇集函数用来汇总数据，这些函数都是高效设计，它们返回的结果通常比你在本身的客户机应用程序中计算要快得多。

10.4 分组数据

前面已经学习了SQL汇集函数来汇总数据。可是，好比：要求出学生表中男生和女生各有多少人。可用使用两条语句分别打印。下面介绍另外一种方式：分组。

分组：把数据分为多个逻辑组，以便能对每一个组进行汇集计算。

10.4.1 建立分组

分组时在SELECT语句的GROUP BY子句中创建的。按照上面的例子，对学生表的男女生分组：

SELECT ssex, COUNT(ssex) AS total FROM student GROUP BY ssex;

输出：

+---------+----------------+
| stu_sex |      total     |
+---------+----------------+
| 女      |              6 |
| 男      |             11 |
+---------+----------------+
3 rows in set (0.05 sec)

可是也可这样使用：

SELECT ssex, COUNT(*) AS total FROM student GROUP BY ssex;

输出结果同上。

为何会这样？？由于使用了GROUP BY，就没必要指定要计算和估值得每一个组了。系统会自动完成。GROUP BY子句指示MySQL分组数据，而后对每一个组而不是整个结果集进行汇集。

在具体使用GROUP BY子句前，须要知道一些重要的规定：

GROUP BY子句能够包括任意数目的列。这使得能对分组进行嵌套，为数据分组提供更细致的控制。
若是在GROUP BY子句中嵌套了分组，数据将在最后规定的分组上进行汇总。换句话说，在创建分组时，指定的全部列都一块儿计算（因此不能从个别的列取回数据）。
GROUP BY子句中列出的每一个列都必须是检索列或有效的表达式（但不能是汇集函数）。若是在SELECT中使用表达式，则必须在GROUP BY子句中指定相同的表达式。不能使用别名。
除汇集计算语句外，SELECT语句中的每一个列都必须在GROUP BY子句中给出。
若是分组列中具备NULL值，则NULL将做为一个分组返回。若是列中有多行NULL值，它们将分为一组。
GROUP BY子句必须出如今WHERE子句以后，ORDER BY子句以前。

使用WITH ROLLUP关键字，能够获得每一个分组以及每一个分组汇总级别（针对每一个分组）的值
好比：

SELECT ssex, COUNT(*) AS total 
FROM student 
GROUP BY ssex WITH ROLLUP;

输出：

+---------+-------+
| stu_sex | total |
+---------+-------+
| 女      |    10 |
| 男      |    16 |
| NULL    |    26 |
+---------+-------+
3 rows in set (0.05 sec)

引入一个函数：IFNULL(expression, alt_value):IFNULL() 函数用于判断第一个表达式是否为 NULL，若是为 NULL 则返回第二个参数的值，若是不为 NULL 则返回第一个参数的值。

SELECT IFNULL(ssex,'总计')  AS ssex, COUNT(*) AS total 
FROM student 
GROUP BY ssex WITH ROLLUP;

输出：

+---------+-------+
| stu_sex | total |
+---------+-------+
| 女      |    10 |
| 男      |    16 |
| 总计    |    26 |
+---------+-------+
3 rows in set (0.05 sec)

10.4.2 过滤分组

MySQL容许过滤分组，规定包括哪些分组，排除哪些分组。可是WHERE子句过滤指定的是行而不是分组。因此MySQL提供了HAVING子句，HAVING子句相似于WHERE，至今为止的全部类型的WHERE子句均可以用HAVING子句来替代。惟一的差异是WHERE子句过滤行，而HAVING子句过滤分组（便是先分组再过滤）。

好比：显示学生表的男生或者女生人数大于15个的。

SELECT ssex, COUNT(*) AS total 
FROM student 
GROUP BY ssex HAVING COUNT(*)>=15;

注意：HAVING子句在GROUP BY以后，由于是对分组的结果进行过滤。而WHERE子句是对行进行过滤，因此必须在GROUP BY以前。因此WHERE子句过滤的行可能会影响到GROUP BY的分组结果。

那么能够同时使用WHERE子句和HAVING子句吗？？答案是能够的。

10.4.3 分组和排序

说一说排序（ORDER BY）和分组（GROUP BY）的区别：

排序	分组
排序产生的输出	输出可能不是分组的顺序
任意列均可以使用（甚至非选择的列也可使用）	只能使用选择列或表达式列，并且必须使用每一个选择列表达式
不必定须要	若是与汇集函数一块儿使用列（或表达式），则必须使用

上面表格的第一行，能够常常发现GROUP BY分组的数据确实是以分组顺序输出的，但状况并不总这样，它并非SQL规范所要求的。此外，用户可能会要求以不一样于分组的顺序排序。仅由于你以某种方式分组数据，并不表示你须要以相同的方式排序输出。应该提供明确的BRDER BY子句，即便其效果等同于GROUP BY子句的输出结果。

因此通常使用GROUP BY子句最好跟上ORDER BY子句。

那么在位置如何放置：ORDER BY子句必定是放在sQL语句最后的。

因此修改上面的语句：例子举得不是很好，就看看怎么写。

SELECT ssex, COUNT(*) AS total 
FROM student 
GROUP BY ssex 
HAVING COUNT(*)>=15
ORDER BY ssex;

小结：学习了如何用SQL汇集函数对数据进行汇总计算。也介绍如何使用GROUP UP子句对数据组进行这些汇总金酸，返回每一个组的结果。并且还学了HAVING子句过滤特定的组，WHERE和HAVING之间以及ORDER BY和GROUP BY之间的差别