咱们常常须要汇总数据而不用把它们实际检索处出来,为此MySQL提供了专门的函数。使用这些函数,MySQL查询可用于检索数据,以便分析和报表的生成。这种类型的检索例子有如下几种:express
上述的例子都须要对表中数据(而不是实际数据自己)汇总。所以,返回实际表数据是对时间和处理资源的一种浪费(更不用说带宽了)。函数
MySQL提供了5个汇集函数。学习
汇集函数(aggregate function)运行在行组上,计算和返回单个值的函数。设计
函数 | 说明 |
---|---|
AVG() | 返回某列的平均值 |
COUNT() | 返回某列的行数 |
MAX() | 返回某列的最大值 |
MIN() | 返回某列的最小值 |
SUM() | 返回某列值之和 |
下面简单介绍这些函数code
先建立下面的表:排序
CREATE TABLE student( sid INT PRIMARY KEY, sname VARCHAR(20), ssex CAHR(1) ); CREATE TABLE score( sid INT PRIMARY KEY, sname VARCHAR(20), smath INT, senglish INT );
AVG()经过对表中行数计数并计算特定列值之和,求得该列的平均值。AVG()可用来返回全部列的平均值,也能够用来返回特定列平均值。资源
AVG()只能用来肯定特定数值列的平均值,并且列名必须做为函数参数给出。为了得到多个列的平均值,必须使用多个AVG()函数。
AVG()函数忽略列值为NULL的行。数学
来使用AVG()函数来查询成绩表score中数学成绩的平均分(本身随便加上几个数):io
SELECT AVG(smath) AS avg_smath FROM score;
AVG()也可用用来肯定特定列平均值,配合WHERE子句。table
COUNT()函数肯定表中行的数目或符合特定条件的行的数目。
COUNT()函数有两种使用的方式:
好比:返回学生总数:
SELECT COUNT(*) FROM student;
返回女生总数(特定列):
SELECT COUNT(ssex) FROM student WHERE ssex='女';
若是指定列名,则指定列的值为空的行被COUNT()函数忽略,但若是COUNT()函数中用的是星号(*),则不忽略。
MAX() 返回指定列中的最大值。MAX() 要求指定列名。
好比:返回成绩表中数学成绩的最高分:
SELECT MAX(smath) FROM score;
虽然MAX()通常用来找出最大的数值或日期值,但MySQL容许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,若是数据按相应的列排序,则MAX()返回最后一行。MIN()函数也是,可是相反,返回最前面的行。
MAX()、MIN()都是忽略列值为NULL的行。
MIN() 返回指定列中的最小值。MIN() 要求指定列名。
好比:返回成绩表中数学成绩的最低分:
SELECT MIN(smath) FROM score;
SUM()用来返回指定列值的和(总计)。
好比返回一个班中的数学成绩的总分:
SELECT SUM(smath) FROM score;
利用标准的算术操做符,全部的汇集函数均可以用来执行多个列上的计算。
SUM()函数忽略列值为NULL的行。
以上5个汇集函数均可以以下使用:
下面举例指定DISTINCT参数的用法:好比成绩表中数学成绩的平均分,平均分只考虑各个不一样的分数:
SELECT AVG(DISTINCT smath) AS avg_smath FROM score;
若是指定列名,则DISTINCT只能用于COUNT(),DISTINCT不能用于COUNT(*),所以不容许使用COUNT(DISTINCT),不然会产生错误。相似地,DISTINCT必须使用列名,不能用于计算或表达式。
DISTINCT可用于MAX()和MIN(),可是没有意义。
实际上SELECT语句可根据须要包含多个汇集函数。
使用汇集函数,最好使用别名。
小结:汇集函数用来汇总数据,这些函数都是高效设计,它们返回的结果通常比你在本身的客户机应用程序中计算要快得多。
前面已经学习了SQL汇集函数来汇总数据。可是,好比:要求出学生表中男生和女生各有多少人。可用使用两条语句分别打印。下面介绍另外一种方式:分组。
分组:把数据分为多个逻辑组,以便能对每一个组进行汇集计算。
分组时在SELECT语句的GROUP BY子句中创建的。按照上面的例子,对学生表的男女生分组:
SELECT ssex, COUNT(ssex) AS total FROM student GROUP BY ssex;
输出:
+---------+----------------+ | stu_sex | total | +---------+----------------+ | 女 | 6 | | 男 | 11 | +---------+----------------+ 3 rows in set (0.05 sec)
可是也可这样使用:
SELECT ssex, COUNT(*) AS total FROM student GROUP BY ssex;
输出结果同上。
为何会这样??由于使用了GROUP BY,就没必要指定要计算和估值得每一个组了。系统会自动完成。GROUP BY子句指示MySQL分组数据,而后对每一个组而不是整个结果集进行汇集。
在具体使用GROUP BY子句前,须要知道一些重要的规定:
使用WITH ROLLUP关键字,能够获得每一个分组以及每一个分组汇总级别(针对每一个分组)的值
好比:
SELECT ssex, COUNT(*) AS total FROM student GROUP BY ssex WITH ROLLUP;
输出:
+---------+-------+ | stu_sex | total | +---------+-------+ | 女 | 10 | | 男 | 16 | | NULL | 26 | +---------+-------+ 3 rows in set (0.05 sec)
引入一个函数:IFNULL(expression, alt_value):IFNULL() 函数用于判断第一个表达式是否为 NULL,若是为 NULL 则返回第二个参数的值,若是不为 NULL 则返回第一个参数的值。
SELECT IFNULL(ssex,'总计') AS ssex, COUNT(*) AS total FROM student GROUP BY ssex WITH ROLLUP;
输出:
+---------+-------+ | stu_sex | total | +---------+-------+ | 女 | 10 | | 男 | 16 | | 总计 | 26 | +---------+-------+ 3 rows in set (0.05 sec)
MySQL容许过滤分组,规定包括哪些分组,排除哪些分组。可是WHERE子句过滤指定的是行而不是分组。因此MySQL提供了HAVING子句,HAVING子句相似于WHERE,至今为止的全部类型的WHERE子句均可以用HAVING子句来替代。惟一的差异是WHERE子句过滤行,而HAVING子句过滤分组(便是先分组再过滤)。
好比:显示学生表的男生或者女生人数大于15个的。
SELECT ssex, COUNT(*) AS total FROM student GROUP BY ssex HAVING COUNT(*)>=15;
注意:HAVING子句在GROUP BY以后,由于是对分组的结果进行过滤。而WHERE子句是对行进行过滤,因此必须在GROUP BY以前。因此WHERE子句过滤的行可能会影响到GROUP BY的分组结果。
那么能够同时使用WHERE子句和HAVING子句吗??答案是能够的。
说一说排序(ORDER BY)和分组(GROUP BY)的区别:
排序 | 分组 |
---|---|
排序产生的输出 | 输出可能不是分组的顺序 |
任意列均可以使用(甚至非选择的列也可使用) | 只能使用选择列或表达式列,并且必须使用每一个选择列表达式 |
不必定须要 | 若是与汇集函数一块儿使用列(或表达式),则必须使用 |
上面表格的第一行,能够常常发现GROUP BY分组的数据确实是以分组顺序输出的,但状况并不总这样,它并非SQL规范所要求的。此外,用户可能会要求以不一样于分组的顺序排序。仅由于你以某种方式分组数据,并不表示你须要以相同的方式排序输出。应该提供明确的BRDER BY子句,即便其效果等同于GROUP BY子句的输出结果。
因此通常使用GROUP BY子句最好跟上ORDER BY子句。
那么在位置如何放置:ORDER BY子句必定是放在sQL语句最后的。
因此修改上面的语句:例子举得不是很好,就看看怎么写。
SELECT ssex, COUNT(*) AS total FROM student GROUP BY ssex HAVING COUNT(*)>=15 ORDER BY ssex;
小结:学习了如何用SQL汇集函数对数据进行汇总计算。也介绍如何使用GROUP UP子句对数据组进行这些汇总金酸,返回每一个组的结果。并且还学了HAVING子句过滤特定的组,WHERE和HAVING之间以及ORDER BY和GROUP BY之间的差别