开窗函数支持分区、排序和框架三种元素,其语法格式以下:express
OVER ( [ <PARTITION BY clause> ] [ <ORDER BY clause> ] [ <ROW or RANGE clause> ] ) <PARTITION BY clause> ::= PARTITION BY value_expression , ... [ n ] <ORDER BY clause> ::= ORDER BY order_by_expression [ COLLATE collation_name ] [ ASC | DESC ] [ ,...n ] <ROW or RANGE clause> ::= { ROWS | RANGE } <window frame extent> <window frame extent> ::= { <window frame preceding> | <window frame between> } <window frame between> ::= BETWEEN <window frame bound> AND <window frame bound> <window frame bound> ::= { <window frame preceding> | <window frame following> } <window frame preceding> ::= { UNBOUNDED PRECEDING | <unsigned_value_specification> PRECEDING | CURRENT ROW } <window frame following> ::= { UNBOUNDED FOLLOWING | <unsigned_value_specification> FOLLOWING | CURRENT ROW } <unsigned value specification> ::= { <unsigned integer literal> }
【窗口分区】:就是将窗口指定列具备相同值的那些行进行分区,分区与分组比较相似,可是分组指定后对于整个SELECT语句只能按照这个分组,不过度区能够在一条语句中指定不一样的分区。
【窗口排序】:分区以后能够指定排序列,那么在窗口计算以前,各个窗口的行的逻辑顺序将肯定。
【窗口框架】:框架是对窗口进行进一步的分区,框架有两种范围限定方式:一种是使用ROWS子句,经过指定当前行以前或以后的固定数目的行来限制分区中的行数;另外一种是RANGE子句,按照排序列的当前值,根据相同值来肯定分区中的行数。框架
一、未使用 partition by 指定分区示例函数
select *, sum(U_Id) over(order by U_Id) 列1, sum(U_Id) over(order by U_Id RANGE BETWEEN unbounded preceding AND CURRENT ROW) 列2, sum(U_Id) over(order by U_Id rows BETWEEN unbounded preceding AND CURRENT ROW) 列3, sum(U_Id) over(order by U_Id rows BETWEEN 1 preceding AND 2 following) 列4, sum(U_Id) over(order by U_Id ROWS BETWEEN 1 PRECEDING AND CURRENT ROW) 列5 from UserInfo
结果分析:性能
RANGE 是逻辑窗口,是指定当前行对应值的范围取值,列数不固定,只要行值在范围内,对应列都包含在内。
ROWS 是物理窗口,即根据order by 子句排序后,取的前N行及后N行的数据计算。(与当前行的值无关,只与排序后的行号相关)spa
二、使用 partition by 指定分区示例3d
select *, sum(U_Id) over(partition by U_Pwd order by U_Id) 列1, sum(U_Id) over(partition by U_Pwd order by U_Id RANGE BETWEEN unbounded preceding AND CURRENT ROW) 列2, sum(U_Id) over(partition by U_Pwd order by U_Id rows BETWEEN unbounded preceding AND CURRENT ROW) 列3, sum(U_Id) over(partition by U_Pwd order by U_Id rows BETWEEN 1 preceding AND 2 following) 列4, sum(U_Id) over(partition by U_Pwd order by U_Id ROWS BETWEEN 1 PRECEDING AND CURRENT ROW) 列5 from UserInfo
以上根据 列(U_Pwd)被分为3个区,使用 partition by 指定分区就是先进行分区,而后再根据指定窗口和指定窗口取值范围进行计算。code
当你用OVER()子句进行你的分析计算来打开你的窗口,你也能够在窗口里看到的,经过ROWS与RANGE选项来限制你的行数。来看下面的T-SQL语句: blog
SELECT t.OrderYear, t.OrderMonth, t.TotalDue, SUM(t.TotalDue) OVER(ORDER BY t.OrderYear, t.OrderMonth ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS 'RunningTotal' FROM ( SELECT YEAR(OrderDate) AS 'OrderYear', MONTH(OrderDate) AS 'OrderMonth', SalesPersonID, TotalDue FROM Sales.SalesOrderHeader ) AS t WHERE t.SalesPersonID = 274 AND t.OrderYear = 2005 GO
这个T-SQL语句用SUM()聚合函数进行汇总计算。窗口自己从第1行(UNBOUNDED PRECEDING)上至当前行(CURRENT ROW)。对于记录级中的每1行,窗口变得愈来愈大,所以很容易进行汇总运算。下图演示了这个概念。排序
从输出你能够看到,结果是个自增加的汇总——运行合计汇总的结果。图片
如今假设你修改窗口为RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW,会发生什么:
SELECT t.OrderYear, t.OrderMonth, t.TotalDue, SUM(t.TotalDue) OVER(ORDER BY t.OrderYear, t.OrderMonth RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS 'RunningTotal' FROM ( SELECT YEAR(OrderDate) AS 'OrderYear', MONTH(OrderDate) AS 'OrderMonth', SalesPersonID, TotalDue FROM Sales.SalesOrderHeader ) AS t WHERE t.SalesPersonID = 274 AND t.OrderYear = 2005 GO
从下图你能够看到,你获得了不一样的结果,对于2005年11月的记录显示一样的汇总。
咱们来尝试理解下为何这里RANGE选项比ROWS选项给你不一样的结果。
使用ROWS选项你定义当前行的固定先后记录。这里你看到的行取决于窗口的ORDER BY从句。你也能够说你在物理级别定义你的窗口。
使用RANGE选项事情就改变了。RANGE选项包含窗口里的全部行,和当前行有相同ORDER BY值。从刚才的图片你能够看到,对于2005年11月的2条记录你拿到同个汇总,由于这2行有一样的ORDER BY值(2005年11月)。使用RANGE选项你在逻辑级别定义你的窗口。若是更多的行有同个ORDER BY值,当你使用ROWS选项你的窗口会包含更多的行。
使用ROWS选项你在物理级别定义在你窗口里有多少行。使用RANGE选项取决于ORDER BY值在窗口里有多少行被包含。所以当你使用RANGE选项时有性能上的巨大区别。