1、MySQL窗口函数服务器
(1) 序号函数session
row_number()在相等的两条记录上随机排序,但序号按照一、2递增,而后后面的序号继续递增为3,中间不会产生序号间隙;函数
rank()/dense_rank()则把前两条相等的记录序号都设置为1,但后续则分别设置为3(rank)和2(dense_rank)。即rank()会产生序号相同的记录,同时可能产生序号间隙;而dense_rank()也会产生序号相同的记录,但不会产生序号间隙。url
(2) 分布函数.net
percent_rank()blog
- 用途:和以前的RANK()函数相关,每行按照以下公式进行计算:
- (rank - 1) / (rows - 1)
- 其中,rank为RANK()函数产生的序号,rows为当前窗口的记录总行数。
- 应用场景:本行序号在该组内所占的位置百分比(不多用)。
cume_dist()排序
- 用途:分组内小于等于当前rank值的行数/分组内总行数,这个函数比percen_rank使用场景更多。
- 应用场景:大于等于当前订单金额的订单比例有多少
(3) 先后函数进程
先后函数——lead(n)/lag(n)。作用域
- 用途:分区中位于当前行前n行(lead)/后n行(lag)的记录值。
- 使用场景:查询上一个订单距离当前订单的时间间隔。
SQL以下:文档
内层SQL先经过lag函数获得上一次订单的日期,外层SQL再将本次订单和上次订单日期作差获得时间间隔diff。
(4) 头尾函数
头尾函数——first_val(expr)/last_val(expr)。
- 用途:获得分区中的第一个/最后一个指定参数的值。
- 使用场景:查询截止到当前订单,按照日期排序第一个订单和最后一个订单的订单金额。
SQL以下:
结果和预期一致,好比order_id为4的记录,first_amount和last_amount分别记录了用户‘001’截止到时间2018-01-03 00:00:00为止,第一条订单金额100和最后一条订单金额800,注意这里是按时间排序的最先订单和最晚订单,并非最小金额和最大金额订单。
(5) 其余函数
其余函数——nth_value(expr,n)/nfile(n)。
nth_value(expr,n)
- 用途:返回窗口中第N个expr的值,expr能够是表达式,也能够是列名。
- 应用场景:每一个用户订单中显示本用户金额排名第二和第三的订单金额。
SQL以下:
nfile(n)
- 用途:将分区中的有序数据分为n个桶,记录桶号。
- 应用场景:将每一个用户的订单按照订单金额分红3组。
SQL以下:
此函数在数据分析中应用较多,好比因为数据量大,须要将数据平均分配到N个并行的进程分别计算,此时就能够用NFILE(N)对数据进行分组,因为记录数不必定被N整除,因此数据不必定彻底平均,而后将不一样桶号的数据再分配。
(6) 聚合函数做为窗口函数
- 用途:在窗口中每条记录动态应用聚合函数(sum/avg/max/min/count),能够动态计算在指定的窗口内的各类聚合函数值。
- 应用场景:每一个用户按照订单id,截止到当前的累计订单金额/平均订单金额/最大订单金额/最小订单金额/订单数是多少?
SQL以下:
除了这几个经常使用的聚合函数,还有一些也可使用,好比BIT_AND()、STD()等等,具体查看官方文档。
2、MySQL变量
MySQL入门 SQL语言之十八:系统变量(全局变量、会话变量),自定义变量(用户变量、局部变量)的使用
#变量
/*
系统变量:
全局变量
会话变量
自定义变量:
用户变量
局部变量
*/
#1、系统变量
/*
说明:变量由系统提供,不是用户定义,属于服务器层面
使用的语法:
一、查看全部的系统变量
show global variables;
SHOW session VARIABLES;#session能够省略
二、查看知足条件的部分系统变量
show VARIABLES variables like '%char%';
三、查看指定的某个系统变量值
select @@global|【session】.系统变量名;
四、为某个系统变量赋值
方式一:
set global|【session】 系统变量名 = 值;
set autocommit = 0;
方式二:
set @@global|【session】.系统变量名 = 值;
注意:
若是是全局级别,则须要加global,若是是会话级别,则须要加session,若是不写,则默认session
*/
#1》、全局变量
/*
做用域:服务器每次启动将为全部的全局变量赋初始值,针对于全部会话(链接)有效,可是不能跨重启。
若是要想每次启动也修改,则须要修改配置文件。
*/
#①查看全部的全局变量
SHOW GLOBAL VARIABLES;
#②查看部分的全局变量
SHOW GLOBAL VARIABLES LIKE '%char%';
#③查看指定的全局量的值
SELECT @@global.autocommit;
SELECT @@tx_isolation;
#④为某个指定全局变量赋值
#方式一:
SET @@global.autocommit = 0;
#方式二:
SET GLOBAL autocommit = 0;
#2》、会话变量
/*
做用域:仅仅针对于当前会话(链接)有效,而且有默认值
*/
#①查看全部的会话变量;
SHOW SESSION VARIABLES;
SHOW VARIABLES;
#②查看部分的会话变量
SHOW VARIABLES LIKE '%char%';
SHOW SESSION VARIABLES LIKE '%char%';
#③查看指定的某个会话变量
SELECT @@tx_isolation;
SELECT @@session.tx_isolation;
#④为某个会话变量赋值
#方式一
SET @@session.tx_isolation = 'read-uncommitted';
#方式二:
SET SESSION tx_isolation = 'read-committed';
#2、自定义变量
/*
说明:变量是用户自定义的,不是由系统的
使用步骤
声明
赋值
使用(查看、比较、运算等)
*/
#一、用户变量
/*
做用域:针对于当前会话(链接)有效,同于会话变量的做用域
应用在任何地方,也就是begin end里面或begin end外边
*/
赋值的操做符: = 或 :=
#①声明并初始化
SET @用户变量名 = 值;
SET @用户变量名 := 值;
SELECT @用户变量名 :=值;
#②赋值(更新用户变量的值)
方式一: 经过SET或SELECT
SET @用户变量名 = 值;
SET @用户变量名 := 值;
SELECT @用户变量名 :=值;
方式二:经过SELECT INTO
SELECT 字段 INTO @变量名
FROM 表;
#③使用(查看用户变量名的值)
SELECT @用户变量名;
#二、局部变量
/*
做用域:仅仅在定义它的begin end中有效
应用在begin end中的第一句话
*/
#①声明
DECLARE 变量名 类型;
DECLARE 变量名 类型 DEFAULT 值;
#②赋值
方式一: 经过SET或SELECT
SET 局部变量名 = 值;
SET 局部变量名 := 值;
SELECT @局部变量名 :=值;
方式二:经过SELECT INTO 局部变量名
SELECT 字段
#③使用
SELECT 局部变量名;
#案例:
#声明并初始化
SET @name = 'john';
SET @name = 100;
SET @count = 1;
#赋值
SELECT COUNT(*) INTO @count
FROM employees;
#查看
SELECT @count;
对比用户变量和局部变量
做用域 定义和使用的位置 语法
用户变量 当前的会话 会话中的任何地方 必须加@符号,不限定类型
局部变量 BEGIN END中 只能在BEGIN END中,且为第一句 通常不加@符号,需限定类型
#案例:声明两个变量并赋初始值,就和,并打印
#1.用户变量
SET @m=1;
SET @n=2;
SET @sum = @m+@n;
SELECT @sum;
#2.局部变量
DECLARE m INT DEFAULT 1;
DECLARE n INT DEFAULT 2;
DECLARE SUM INT;
SET SUM = m + n;
SELECT SUM;
#报错
本文转载自:
http://www.sohu.com/a/260324504_411876;
https://blog.csdn.net/qq_34626097/article/details/86528466;