Oracle分析函数-统计(sum、avg、max、min)

不少需求中都涉及到统计:均值、累计、范围均值、相邻记录比较等。这些操做会统计屡次,或有明确的统计范围,或返回的记录统计的数据集不一样...函数

根据场景不一样可分为以下几类:
1. 全统计
2. 滚动统计
3. 范围统计
4. (相邻)行比较测试

构建测试数据:spa

SQL> desc criss_sales;
Name       Type        Nullable Default Comments 
---------- ----------- -------- ------- -------- 
DEPT_ID    VARCHAR2(6) Y                         
SALE_DATE  DATE        Y                         
GOODS_TYPE VARCHAR2(4) Y                         
SALE_CNT   NUMBER(10)  Y 


SQL> select * from criss_sales order by dept_id,sale_date desc;
 
DEPT_ID SALE_DATE   GOODS_TYPE    SALE_CNT
------- ----------- ---------- -----------
D01     2014/5/4    G02                 80
D01     2014/4/30   G03                800
D01     2014/4/8    G01                200
D01     2014/3/4    G00                700
D02     2014/5/2    G03                900
D02     2014/4/27   G01                300
D02     2014/4/8    G02                100
D02     2014/3/6    G00                500

一.全统计
最经常使用的全统计就是均值或求和,有时会要求同一行记录包含不一样范围的全统计。
例:
为数据集统计部门销售总和,全公司销售总和,部门销售均值,全公司销售均值3d

select
      dept_id
     ,sale_date
     ,goods_type
     ,sale_cnt
     ,sum(sale_cnt) over (partition by dept_id) dept_total
     ,sum(sale_cnt) over() cmp_total
     ,avg(sale_cnt) over (partition by dept_id) avg_dept
     ,avg(sale_cnt) over() avg_cmp
from criss_sales;

这样在同一行记录,就获得了部门范围的全统计(均值/求和)和公司范围的全统计(均值/求和)。code

二.滚动统计
滚动统计最经常使用的一个场景之一是累计。blog

例:
计算部门和全公司的销售树量累计值。排序

select
      dept_id
     ,sale_date
     ,goods_type
     ,sale_cnt
     ,sum(sale_cnt) over(partition by dept_id order by dept_id,sale_date rows between unbounded preceding and current row) dept_cur_total
     ,sum(sale_cnt) over(order by dept_id,sale_date rows between unbounded preceding and current row) cmp_cur_total
from criss_sales;

固然,滚动查询也能够计算当前平均值~这里就不在赘述了it

三.范围统计
有时候,咱们每每关注必定范围内的数据,例如时间范围(一周内的数据),记录范围(前三条记录到当前记录)。io

例:按日期排序,求相相邻三次销售记录的和class

select
      dept_id
     ,sale_date
     ,goods_type
     ,sale_cnt
     ,sum(sale_cnt) over(order by sale_date rows between 1 preceding and 1 following) CON_1_CNT
from criss_sales;

时间范围例子:
按日期排序,求当前记录日期前三天到后天三的销售数量和

select
      dept_id
     ,sale_date
     ,goods_type
     ,sale_cnt
     ,sum(sale_cnt) over(order by sale_date range between interval '3' day preceding and interval '3' day following) sum_7_days
from criss_sales;

四.(相邻)行比较
其实用over(order by xxx rows between 1 preceding and 0 following)也能实现相邻行的对比。
可是,Oracle提供更方便的两个函数 
lead() 与后面某一行对比
lag()  与前面一行对比


按时间排序,显示当前记录的数量以及先后相邻记录的销售数量

select
      dept_id
     ,sale_date
     ,goods_type
     ,sale_cnt
     ,lag(sale_cnt,1) over(order by sale_date) lag_1
     ,lead(sale_cnt,1) over(order by sale_date) lead_1
     ,first_value(sale_cnt) over(order by sale_date rows between 1 preceding and 0 following)
from criss_sales;

最后一列是利用over(order by xxx rows between 1 preceding and 0 following)与 lag作对比。一样能够获得咱们但愿看到的结果。

相关文章
相关标签/搜索