第八章 使用数据处理函数
8.1 函数
SQL支持利用函数来处理数据。函数通常是在数据上执行的,给数据的转换和处理提供了方便。
每个DBMS都有特定的函数。只有少数几个函数被全部主要的DBMS等同的支持。
8.2 使用函数
大多数SQL实现支持如下类型的函数:
用于处理文本串(如删除或填充值,转换值为大写或小写)的文本函数
用于在数值数据上进行算术操做(如返回绝对值,进行代数运算)的数值函数
用于处理日期和时间值并从这些值中提取特定成分(如,返回两个日期之差,检查日期有效性等)的日期和时间函数
返回DBMS正使用的特殊信息(如返回用户登陆信息)的系统函数
8.2.1 文本处理函数
1.UPPER() 函数将文本转换为大写
SELECT member_name,UPPER(member_name) AS
member_name_upcase
FROM personal_appeal
ORDER BY member_name;
列出两列,第一列是表中存储的值,第二列 member_name_upcase 转换为大写
经常使用的文本函数:
SOUNDEX是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。
SOUNDEX考虑了相似的发音字符和音节,使得能对串进行发音比较而不是字母比较,多数DBMS都提供了对SOUNDEX的支持。
使用SOUNDEX()函数进行搜索: 匹配全部发音相似于LV的联系名
SELECT member_name FROM personal_appeal WHERE SOUNDEX(member_name)= SOUNDEX('LV');
WHERE 子句使用 SOUNDEX()函数来转换 member_name 列值和搜索串为它们的 SOUNDEX 值。
8.2.2 日期和时间处理函数
日期和时间采用相应的数据类型存储在表中,每种DBMS都有本身的变体。日期和时间值以特殊的格式存储,以便能快速和有效地排序或过滤,而且节省物理存储空间。
通常,应用程序不使用用来存储日期和时间的格式,所以日期和时间函数老是被用来读取、统计和处理这些值。
日期和时间函数在SQL中具备重要的做用。
SELECT member_name,time_add FROM personal_appeal WHERE YEAR(time_add) = 2017;
MYSQL 使用 YEAR 函数从日期中提取年份
DBMS提供的功能远不止简单的日期成分提取。大多数DBMS具备比较日期、执行基于日期的运算、选择日期格式等的函数。
不一样DBMS的日期-时间处理函数可能不一样。详见相应文档
8.2.3 数值处理函数
数值处理函数仅处理数值数据。这些函数通常主要用于代数、三角或几何运算,所以没有串或日期-时间处理函数的使用那么频繁
经常使用的数值处理函数:
本章介绍如何使用SQL的数据处理函数。这些函数在格式化、处理和过滤数据中很是有用,但它们在各类SQL实现中很不一致。
第九章 汇总数据
本章介绍什么是SQL的汇集函数以及如何利用它们汇总表的数据。
9.1 汇集函数
常常须要汇总数据而不用实际检索出来,SQL提供了专门的函数。使用这些函数,SQL查询可用于检索数据,以便分析和报表生成。
这种类型的检索例子有:
肯定表中行数(或者知足某个条件或包含某个特定值的行数)
得到表中行组的和
找出表列(或全部行或某些特定的行) 的最大、最小、平均值。
上述例子都须要对表中数据汇总而不是检索实际数据自己。所以,返回实际表数据是对时间和处理资源的一种浪费(更不用说带宽)。
为方便这种类型的检索,SQL给出了5个汇集函数。
汇集函数:运行在行组上,计算和返回单个值的函数
9.1.1 AVG()函数
经过对表中行数计数并计算特定列值之和,求得该列的平均值。
AVG()可用来返回全部列的平均值,也能够用来返回特定列或行的平均值。
使用AVG()返回 member_jifen 表中全部用户的平均总积分
AVG()函数只能用来肯定特定数值列的平均值,并且列名必须做为函数参数给出。
NULL值:AVG()函数忽略列值为NULL的行
9.1.2 COUNT()函数
COUNT()函数进行计数。可用COUNT()肯定表中行的数目或符合特定条件的行的数目。
COUNT()函数有两种使用方式:
使用COUNT(*)对表中行的数目进行计数,无论表列中包含的是空值(NULL)仍是非空值。
使用COUNT(column)对特定列中具备值的行进行计数,忽略NULL值。

利用 COUNT(*)对全部行计数,无论行中各列有什么值。计数值在num_member中返回。
只对绑定了邮箱的客户计数
NULL值:若是指定列名,指定列的值为空的行被COUNT()函数忽略,但若是 COUNT()函数中用的是星号*,则不忽略
9.1.3 MAX()函数
MAX()返回指定列中的最大值。MAX()要求指定列名。
返回member_id值最大的用户名和member_id
NULL值:MAX()函数忽略列值为NULL的行
9.1.4 MIN()函数
MIN()函数返回指定列的最小值。与MAX()同样,MIN()要求指定列名
用法同 MAX()
9.1.5 SUM()函数
SUM()用来返回指定列值的和(总计)。

列出2017年添加的用户的全部安全分数值
以上5个汇集函数均可以以下使用:
对全部的行执行计算,指定ALL参数或不给参数(由于ALL是默认行为)
只包含不一样的值,指定DISTINCT参数
ALL为默认:ALL参数不须要指定,由于它是默认行为。若是不指定DISTINCT,则假定为ALL
9.3 组合汇集函数
SELECT语句能够根据须要包含多个汇集函数
用单条SELECT语句执行了4个汇集计算,返回4个值。
取别名:在指定别名以包含某个汇集函数的结果时,不该该使用表中实际的列名。虽然这样作并不是不合法,但许多SQL实现不支持,可能会产生模糊的错误消息。
汇集函数用来汇总数据。SQL支持5个汇集函数,能够用多种方法使用它们以返回所需的结果。
这些函数是高效设计的,它们返回结果通常比你在本身的客户机应用程序中计算要快得多。
第十章 分组数据
本章介绍如何分组数据,以便能汇总表内容的子集。
设计两个新SELECT语句子句,分别是:GROUP BY 子句和 HAVING 子句
10.1 数据分组
分组容许把数据分为多个逻辑组,以便能对每一个组进行汇集计算
建立分组
分组是在SELECT语句的GROUP BY 子句中创建的。
上面的SELECT子句指定了两个列,num_item为计算字段,表示当前积分数的总个数,
GROUP BY子句指示DBMS按tota_jf 排序并分组数据
GROUP BY子句指示DBMS分组数据,而后对每一个组而不是整个结果集进行汇集
使用GROUP BY子句前,须要知道一些重要规定:
1.GROUP BY子句能够包含任意数目的列。这使得能对分组进行嵌套,为数据分组提供更细致的控制。
2.若是在GROUP BY子句中嵌套了分组,数据将在最后规定的分组上进行汇总
3.GROUP BY子句中列出的每一个列都必须是检索列或有效地表达式(但不能是汇集函数)。
在SELECT中使用表达式,必须在GROUP BY 子句中指定相同的表达式,不能使用别名。
4.大多数SQL实现不容许GROUP BY列带有长度可变的数据类型(如文本或备注型字段)
若是分组列中具备NULL值,则NULL将做为一个分组返回。若是列中有多行NULL值,它们将分为一组。
5.GROUP BY子句必须出如今WHERE子句以后,ORDER BY子句以前。
10.2 过滤分组
除了能用GROUP BY分组数据外,SQL还容许过滤分组,规定包括哪些分组,排除哪些分组。
列出至少有两个相同总积分的会员,为得出这种数据,必须基于完整的分组而不是个别的行进行过滤。
WHERE过滤指定的是列而不是分组。WHERE没有分组的概念
HAVING相似于WHERE,目前为止学过的全部类型的WHERE子句均可以用HAVING来替代。惟一的差异是WHERE过滤行,HAVING过滤分组。
HAVING支持全部的WHERE操做符
HAVING和WHERE的差异:
WHERE在数据分组前进行过滤,HAVING在数据分组后进行过滤。
WHERE排除的行不包括在分组中。这可能会改变计算值,从而影响HAVING子句中基于这些值过滤掉的分组。
应该仅在与GROUP BY子句结合时才使用HAVING,而WHERE子句用于标准的行级过滤。


