3、函数（SUM、MIN、MAX、COUNT、AVG）

时间 2020-04-25

标签函数 sum min max count avg 繁體版

原文原文链接

第八章使用数据处理函数

8.1 函数

SQL支持利用函数来处理数据。函数通常是在数据上执行的，给数据的转换和处理提供了方便。

每个DBMS都有特定的函数。只有少数几个函数被全部主要的DBMS等同的支持。

8.2 使用函数

大多数SQL实现支持如下类型的函数：

　　用于处理文本串（如删除或填充值，转换值为大写或小写）的文本函数

　　用于在数值数据上进行算术操做（如返回绝对值，进行代数运算）的数值函数

　　用于处理日期和时间值并从这些值中提取特定成分（如,返回两个日期之差，检查日期有效性等）的日期和时间函数

　　返回DBMS正使用的特殊信息（如返回用户登陆信息）的系统函数

　　8.2.1 文本处理函数

　　1.UPPER（）函数将文本转换为大写

　　SELECT member_name,UPPER(member_name) AS

　　member_name_upcase

　　FROM personal_appeal

　　ORDER BY member_name;

列出两列，第一列是表中存储的值，第二列 member_name_upcase 转换为大写

经常使用的文本函数：

SOUNDEX是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。

SOUNDEX考虑了相似的发音字符和音节，使得能对串进行发音比较而不是字母比较，多数DBMS都提供了对SOUNDEX的支持。

使用SOUNDEX（）函数进行搜索: 匹配全部发音相似于LV的联系名

SELECT member_name FROM personal_appeal WHERE SOUNDEX(member_name)= SOUNDEX('LV');

WHERE 子句使用 SOUNDEX（）函数来转换 member_name 列值和搜索串为它们的 SOUNDEX 值。

8.2.2 日期和时间处理函数

日期和时间采用相应的数据类型存储在表中，每种DBMS都有本身的变体。日期和时间值以特殊的格式存储，以便能快速和有效地排序或过滤，而且节省物理存储空间。

通常，应用程序不使用用来存储日期和时间的格式，所以日期和时间函数老是被用来读取、统计和处理这些值。

日期和时间函数在SQL中具备重要的做用。

SELECT member_name,time_add FROM personal_appeal WHERE YEAR(time_add) = 2017;

MYSQL 使用 YEAR 函数从日期中提取年份

DBMS提供的功能远不止简单的日期成分提取。大多数DBMS具备比较日期、执行基于日期的运算、选择日期格式等的函数。

不一样DBMS的日期-时间处理函数可能不一样。详见相应文档

8.2.3 数值处理函数

数值处理函数仅处理数值数据。这些函数通常主要用于代数、三角或几何运算，所以没有串或日期-时间处理函数的使用那么频繁

经常使用的数值处理函数：

本章介绍如何使用SQL的数据处理函数。这些函数在格式化、处理和过滤数据中很是有用，但它们在各类SQL实现中很不一致。

第九章汇总数据

　　本章介绍什么是SQL的汇集函数以及如何利用它们汇总表的数据。

9.1 汇集函数

常常须要汇总数据而不用实际检索出来，SQL提供了专门的函数。使用这些函数，SQL查询可用于检索数据，以便分析和报表生成。

这种类型的检索例子有：

　　肯定表中行数（或者知足某个条件或包含某个特定值的行数）

　　得到表中行组的和

　　找出表列（或全部行或某些特定的行）的最大、最小、平均值。

上述例子都须要对表中数据汇总而不是检索实际数据自己。所以，返回实际表数据是对时间和处理资源的一种浪费（更不用说带宽）。

　　为方便这种类型的检索，SQL给出了5个汇集函数。

　　汇集函数：运行在行组上，计算和返回单个值的函数

9.1.1 AVG（）函数

经过对表中行数计数并计算特定列值之和，求得该列的平均值。

AVG（）可用来返回全部列的平均值，也能够用来返回特定列或行的平均值。

使用AVG（）返回 member_jifen 表中全部用户的平均总积分

AVG（）函数只能用来肯定特定数值列的平均值，并且列名必须做为函数参数给出。

NULL值：AVG（）函数忽略列值为NULL的行

9.1.2 COUNT（）函数

COUNT（）函数进行计数。可用COUNT（）肯定表中行的数目或符合特定条件的行的数目。

COUNT（）函数有两种使用方式：

　　使用COUNT(*)对表中行的数目进行计数，无论表列中包含的是空值（NULL）仍是非空值。

　　使用COUNT（column）对特定列中具备值的行进行计数，忽略NULL值。

利用 COUNT(*)对全部行计数，无论行中各列有什么值。计数值在num_member中返回。

只对绑定了邮箱的客户计数

NULL值：若是指定列名，指定列的值为空的行被COUNT（）函数忽略，但若是 COUNT（）函数中用的是星号*，则不忽略

9.1.3 MAX（）函数

　　MAX（）返回指定列中的最大值。MAX（）要求指定列名。

返回member_id值最大的用户名和member_id

NULL值：MAX（）函数忽略列值为NULL的行

9.1.4 MIN（）函数

MIN（）函数返回指定列的最小值。与MAX（）同样，MIN（）要求指定列名

用法同 MAX（）

9.1.5 SUM（）函数

SUM（）用来返回指定列值的和（总计）。

列出2017年添加的用户的全部安全分数值

9.2 汇集不一样值

以上5个汇集函数均可以以下使用：

　　对全部的行执行计算，指定ALL参数或不给参数（由于ALL是默认行为）

　　只包含不一样的值，指定DISTINCT参数

　　ALL为默认：ALL参数不须要指定，由于它是默认行为。若是不指定DISTINCT,则假定为ALL

9.3 组合汇集函数

SELECT语句能够根据须要包含多个汇集函数

用单条SELECT语句执行了4个汇集计算，返回4个值。

取别名：在指定别名以包含某个汇集函数的结果时，不该该使用表中实际的列名。虽然这样作并不是不合法，但许多SQL实现不支持，可能会产生模糊的错误消息。

汇集函数用来汇总数据。SQL支持5个汇集函数，能够用多种方法使用它们以返回所需的结果。

这些函数是高效设计的，它们返回结果通常比你在本身的客户机应用程序中计算要快得多。

第十章分组数据

本章介绍如何分组数据，以便能汇总表内容的子集。

设计两个新SELECT语句子句，分别是：GROUP BY 子句和 HAVING 子句

10.1 数据分组

分组容许把数据分为多个逻辑组，以便能对每一个组进行汇集计算

建立分组

分组是在SELECT语句的GROUP BY 子句中创建的。

上面的SELECT子句指定了两个列，num_item为计算字段，表示当前积分数的总个数，

GROUP BY子句指示DBMS按tota_jf 排序并分组数据

GROUP BY子句指示DBMS分组数据，而后对每一个组而不是整个结果集进行汇集

使用GROUP BY子句前，须要知道一些重要规定：

　　1.GROUP BY子句能够包含任意数目的列。这使得能对分组进行嵌套，为数据分组提供更细致的控制。

　　2.若是在GROUP BY子句中嵌套了分组，数据将在最后规定的分组上进行汇总

　　3.GROUP BY子句中列出的每一个列都必须是检索列或有效地表达式（但不能是汇集函数）。

　　在SELECT中使用表达式，必须在GROUP BY 子句中指定相同的表达式，不能使用别名。

　　4.大多数SQL实现不容许GROUP BY列带有长度可变的数据类型（如文本或备注型字段）

　　若是分组列中具备NULL值，则NULL将做为一个分组返回。若是列中有多行NULL值，它们将分为一组。

　　5.GROUP BY子句必须出如今WHERE子句以后，ORDER BY子句以前。

10.2 过滤分组

除了能用GROUP BY分组数据外，SQL还容许过滤分组，规定包括哪些分组，排除哪些分组。

列出至少有两个相同总积分的会员，为得出这种数据，必须基于完整的分组而不是个别的行进行过滤。

WHERE过滤指定的是列而不是分组。WHERE没有分组的概念

HAVING相似于WHERE，目前为止学过的全部类型的WHERE子句均可以用HAVING来替代。惟一的差异是WHERE过滤行，HAVING过滤分组。

HAVING支持全部的WHERE操做符

HAVING和WHERE的差异：

WHERE在数据分组前进行过滤，HAVING在数据分组后进行过滤。

WHERE排除的行不包括在分组中。这可能会改变计算值，从而影响HAVING子句中基于这些值过滤掉的分组。

应该仅在与GROUP BY子句结合时才使用HAVING，而WHERE子句用于标准的行级过滤。

10.3 分组和排序

3、函数 （SUM、MIN、MAX、COUNT、AVG）

3、函数（SUM、MIN、MAX、COUNT、AVG）