Oracle中分析函数over()的用法及说明

目录
  • 1 over()分析函数
    • 1.1 rank()/dense_rank()
    • 1.2 min()/max()
    • 1.3 lead()/lag()
    • 1.4 FIRST_VALUE/LAST_VALUE()
    • 1.5 ROW_NUMBER()
    • 1.6 sum/avg/count()
    • 1.7 rows/range
  • 2 其他
    • 2.1 NULLS FIRST/LAST
    • 2.2 NTILE(n)
    • 2.3 keep(dense_rank first/last)
  • 总结

1 over()分析函数

说明:聚合函数(如sum()max()等)可以计算基于组的某种聚合值,但是聚合函数对于某个组只能返回一行记录。若想对于某组返回多行记录,则需要使用分析函数。

1.1 rank()/dense_rank()

1.1.1 基础

rank()/dense_rank over(partition by ... order by ...)

说明:

  • over()在什么条件之上;
  • partition by 按哪个字段划分组(如果要分组必须,有此关键字partition);
  • order by 按哪个字段排序;

注意:

  • 使用rank()/dense_rank()时,必须要带order by否则非法
  • rank()/dense_rank()分级的区别

rank(): 跳跃排序,如果有两个第一级时,接下来就是第三级。

dense_rank():连续排序,如果有两个第一级时,接下来仍然是第二级。

1.1.2 示例

示例:查询每个部门工资最高的员工信息

一般的写法:

SELECT E.ENAME, E.JOB, E.SAL, E.DEPTNO
  FROM SCOTT.EMP E,
       (SELECT E.DEPTNO, MAX(E.SAL) SAL FROM SCOTT.EMP E GROUP BY E.DEPTNO) ME
 WHERE E.DEPTNO = ME.DEPTNO
   AND E.SAL = ME.SAL;

使用Over()函数:

方法一:

SELECT E.ENAME, E.JOB, E.SAL, E.DEPTNO
  FROM (SELECT E.ENAME,
               E.JOB,
               E.SAL,
               E.DEPTNO,
               RANK() OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL DESC) RANK  --在按部门划分的基础上,工资从高到低分级,级别RANK从1开始依次递增
     FROM EMP E) E
 WHERE E.RANK = 1 ;

方法二:

SELECT E.ENAME, E.JOB, E.SAL, E.DEPTNO
  FROM (SELECT E.ENAME,
               E.JOB,
               E.SAL,
               E.DEPTNO,
               DENSE_RANK() OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL DESC) RANK
          FROM EMP E) E
 WHERE E.RANK = 1;

对比查询结果:左边的是用一般的方法查询结果,右边的是分析函数查询结果(两种方法结果相同)

1.2 min()/max()

 min()/max() over(partition by ...) 

1.2.1 示例

查询员工信息的同时,查询员工工资与所在部门最低、最高工资的差额

一般的写法:

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       E.SAL - ME.MIN_SAL DIFF_MIN_SAL,
       ME.MAX_SAL - E.SAL DIFF_MAX_SAL
  FROM SCOTT.EMP E,
       (SELECT E.DEPTNO, MIN(E.SAL) MIN_SAL, MAX(E.SAL) MAX_SAL
          FROM SCOTT.EMP E
         GROUP BY E.DEPTNO) ME
 WHERE E.DEPTNO = ME.DEPTNO
 ORDER BY E.DEPTNO, E.SAL;

使用分析函数:

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       MIN(E.SAL) OVER(PARTITION BY E.DEPTNO) MIN_SAL,
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO) MAX_SAL,
       NVL(E.SAL - MIN(E.SAL) OVER(PARTITION BY E.DEPTNO), 0) DIFF_MIN_SAL,
       NVL(MAX(E.SAL) OVER(PARTITION BY E.DEPTNO) - E.SAL, 0) DIFF_MAX_SAL
  FROM EMP E;

注:这里没有排序条件,若加上order by 排序条件

  • MAX() OVER(PARTITION BY .. ORDER BY .. DESC) 排序规则只能为desc,否则不起作用,将查询到目前为止排序值最高字段的对应值
  • MIN() OVER(PARTITION BY .. ORDER BY .. ASC )排序规则只能为asc,否则不起作用,将查询到目前为止排序值最低的字段的对应值

如下:

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       MIN(E.SAL) OVER(PARTITION BY E.DEPTNO) MIN_SAL01,
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO) MAX_SAL01,
       MIN(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) MIN_SAL02,
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) MAX_SAL02, --不起作用
       MIN(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL DESC) MIN_SAL03, --不起作用
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL DESC) MAX_SAL03,
       MIN(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL ASC) MIN_SAL04,
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL ASC) MAX_SAL04, --不起作用
       NVL(E.SAL - MIN(E.SAL) OVER(PARTITION BY E.DEPTNO), 0) DIFF_MIN_SAL,
       NVL(MAX(E.SAL) OVER(PARTITION BY E.DEPTNO) - E.SAL, 0) DIFF_MAX_SAL
  FROM EMP E;

结果如下:

1.3 lead()/lag()

1.3.1 基础

lead()/lag()  over(partition by ... order by ...) 

前面/后面n行记录说明:

  • lead(列名,n,m): 当前记录后面第n行记录的列名的值,没有则默认值为m;如果不带参数n,m,则查找当前记录后面第一行的记录列名的值,没有则默认值为null
  • lag(列名,n,m): 当前记录前面第n行记录的列名的值,没有则默认值为m;如果不带参数n,m,则查找当前记录前面第一行的记录列名的值,没有则默认值为null

1.3.2 示例

查询个人工资与比自己高一位、低一位的工资的差额

使用分析函数:

SELECT E.ENAME,
        E.JOB,
        E.SAL,
        E.DEPTNO,
        LEAD(E.SAL, 1, 0) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) LEAD_SAL, --记录后面第n行记录
        LAG(E.SAL, 1, 0) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) LAG_SAL, --记录前面第N行记录
        NVL(LEAD(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) - E.SAL,
            0) DIFF_LEAD_SAL,
        NVL(E.SAL - LEAD(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL),
            0) DIFF_LAG_SAL
   FROM EMP E;

查询结果:

1.4 FIRST_VALUE/LAST_VALUE()

FIRST_VALUE/LAST_VALUE()  OVER(PARTITION BY ...) 

取首尾记录示例:

SELECT E.EMPNO,
        E.ENAME,
        E.JOB,
        E.MGR,
        E.SAL,
        E.DEPTNO,
        FIRST_VALUE(E.SAL) OVER(PARTITION BY E.DEPTNO) FIRST_SAL,
        LAST_VALUE(E.SAL) OVER(PARTITION BY E.DEPTNO) LAST_SAL
   FROM EMP E;

查询结果:

1.5 ROW_NUMBER()

ROW_NUMBER() OVER(PARTITION BY.. ORDER BY ..) 

排序(应用:分页)

示例:

SELECT E.ENAME, E.JOB, E.SAL, E.DEPTNO,E.ROW_NUM
   FROM (SELECT E.ENAME,
                E.JOB,
                E.SAL,
                E.DEPTNO,
                ROW_NUMBER() OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) ROW_NUM
           FROM EMP E) E
  WHERE E.ROW_NUM > 3;

查询结果:

补充:类似分页的操作还可以用rownumfetch(Oracle12C后的新特性)实现

1.6 sum/avg/count()

 sum/avg/count() over(partition by ..)

示例1:

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       SUM(E.SAL) OVER(PARTITION BY E.DEPTNO) SUM_SAL,     --统计某组中的总计值
       AVG(E.SAL) OVER(PARTITION BY E.DEPTNO) AVG_SAL,     --统计某组中的平均值
       COUNT(E.SAL) OVER(PARTITION BY E.DEPTNO) COUNT_SAL  --按某列分组,并统计该组中记录数量
  FROM EMP E;

查询结果:

示例2(全统计):为数据集统计部门销售总和,全公司销售总和,部门销售均值,全公司销售均值

SELECT A.DEPT_ID,
       A.SALE_DATE,
       A.GOODS_TYPE,
       A.SALE_CNT,
       SUM(A.SALE_CNT) OVER(PARTITION BY A.DEPT_ID) DEPT_TOTAL, --部门销售总和
       SUM(A.SALE_CNT) OVER() CMP_TOTAL,  --公司销售总额
       AVG(A.SALE_CNT) OVER(PARTITION BY A.DEPT_ID) DEPT_AVG, --部门销售均值
       AVG(A.SALE_CNT) OVER() CMP_AVG  --公司销售均值
  FROM LEARN_FUN_KEEP A;  

1.7 rows/range

rows/range  between … preceding and … following

1.7.1 基础

上下范围内求值说明:

  • unbounded:不受控制的,无限的
  • preceding:在…之前
  • following:在…之后
rows between … preceding and … following

示例1:

显示各部门员工的工资,并附带显示该部门的最高工资

写法一:

SELECT E.DEPTNO,
       E.EMPNO,
       E.ENAME,
       E.SAL,
       LAST_VALUE(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL ROWS
       /*MAX(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL ROWS*/
       --unbounded preceding and unbouned following针对当前所有记录的前一条、后一条记录,也就是表中的所有记录
       --unbounded:不受控制的,无限的
       --preceding:在...之前
       --following:在...之后
        BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) MAX_SAL
  FROM EMP E;

结果如下:

写法二:

SELECT E.DEPTNO,
       E.EMPNO,
       E.ENAME,
       E.SAL,
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO
       /*ORDER BY E.SAL*/) MAX_SAL
  FROM EMP E;

示例2:

对各部门进行分组,并附带显示第一行至当前行的汇总

SELECT EMPNO,
       ENAME,
       DEPTNO,
       SAL,
       --注意ROWS BETWEEN unbounded preceding AND current row  是指第一行至当前行的汇总
       SUM(SAL) OVER(PARTITION BY DEPTNO
                     ORDER BY ENAME
                     ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) max_sal
  FROM SCOTT.EMP;

结果如下:

示例3:

当前行至最后一行的汇总

SELECT EMPNO,
       ENAME,
       DEPTNO,
       SAL,
       --注意ROWS BETWEEN current row AND unbounded following 指当前行到最后一行的汇总
       SUM(SAL) OVER(PARTITION BY DEPTNO
                     ORDER BY ENAME
                     ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING) max_sal
  FROM SCOTT.EMP;

结果如下:

示例4:

当前行的上一行(rownum-1)到当前行的汇总

SELECT EMPNO,
       ENAME,
       DEPTNO,
       SAL,
       --注意ROWS BETWEEN 1 preceding AND current row 是指当前行的上一行(rownum-1)到当前行的汇总
       SUM(SAL) OVER(PARTITION BY DEPTNO
                     ORDER BY ENAME ROWS
                     BETWEEN 1 PRECEDING AND CURRENT ROW) max_sal
  FROM SCOTT.EMP;

结果如下:

示例5:

当前行的上一行(rownum-1)到当前行的下两行(rownum+2)的汇总

SELECT EMPNO,
       ENAME,
       DEPTNO,
       SAL,
       --注意ROWS BETWEEN 1 preceding AND 1 following 是指当前行的上一行(rownum-1)到当前行的下辆行(rownum+2)的汇总
       SUM(SAL) OVER(PARTITION BY DEPTNO
                     ORDER BY ENAME
                     ROWS BETWEEN 1 PRECEDING AND 2 FOLLOWING) max_sal
  FROM SCOTT.EMP;

结果如下:

2 其他

2.1 NULLS FIRST/LAST

将空值字段记录放到最前或最后显示

说明:通过RANK()DENSE_RANK()ROW_NUMBER()对记录进行全排列、分组排列取值,但有时候,会遇到空值的情况,空值会影响得到的结果的正确性

NULLS FIRST/LAST 可以帮助我们在处理含有空值的排序排列中,将空值字段记录放到最前最后显示,帮助我们得到期望的结果

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       RANK() OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL NULLS LAST)
  FROM EMP E;

结果如下:

2.2 NTILE(n)

有时会有这样的需求:如果数据排序后分为三部分,业务人员只关心其中的一部分,如何将这中间的三分之一数据拿出来呢?

这时比较好的选择,就是使用NTILE函数

示例:

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       NTILE(3) OVER(ORDER BY E.SAL DESC NULLS LAST) ALL_CMP, --若只取前三分之一,all_cmp=1即可,若只取中间三分之一,all_cmp=2即可
       NTILE(3) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL DESC NULLS LAST) ALL_DEPT  --每个部门的分成三部分
  FROM EMP E

结果如下:

2.3 keep(dense_rank first/last)

说明:

keep字面意思就是保持,也就是说保存满足keep()括号内条件的记录,这里可以想象到,会有多条记录的情况,即存在多个lastfirst的情况

  • dense_rank是排序策略
  • first/last是筛选策略

示例:

查看部门 D02 内,销售记录时间最早,销售量最小的记录

SELECT A.DEPT_ID,
       MIN(A.SALE_CNT) KEEP(DENSE_RANK FIRST ORDER BY A.SALE_DATE) MIN_EARLY_DATE
  FROM LEARN_FUN_KEEP A
 WHERE A.DEPT_ID = 'D02'
 GROUP BY A.DEPT_ID;

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • 深入探讨:oracle中row_number() over()分析函数用法

    row_number()over(partition by col1 order by col2)表示根据col1分组,在分组内部根据col2排序,而此函数计算的值就表示每组内部排序后的顺序编号(组内连续的唯一的). 与rownum的区别在于:使用rownum进行排序的时候是先对结果集加入伪劣rownum然后再进行排序,而此函数在包含排序从句后是先排序再计算行号码. row_number()和rownum差不多,功能更强一点(可以在各个分组内从1开始排序). rank()是跳跃排序,有两个第二名

  • Oracle开发之分析函数简介Over用法

    一.Oracle分析函数简介: 在日常的生产环境中,我们接触得比较多的是OLTP系统(即Online Transaction Process),这些系统的特点是具备实时要求,或者至少说对响应的时间多长有一定的要求:其次这些系统的业务逻辑一般比较复杂,可能需要经过多次的运算.比如我们经常接触到的电子商城. 在这些系统之外,还有一种称之为OLAP的系统(即Online Aanalyse Process),这些系统一般用于系统决策使用.通常和数据仓库.数据分析.数据挖掘等概念联系在一起.这些系统的特点

  • Oracle百分比分析函数RATIO_TO_REPORT() OVER()实例详解

    有时候不用的指标的绝对值不能比,但是转转为百分比的形式就容易看出波动了,是数据分析的好用的一个分析函数 20:00:24 SYS@orcl> conn scott/tiger; Connected. 20:00:30 SCOTT@orcl> create table test 20:01:22 2 ( 20:01:22 3 name varchar(20), 20:01:22 4 kemu varchar(20), 20:01:22 5 score number 20:01:22 6 ); T

  • Oracle中分析函数over()的用法及说明

    目录 1 over()分析函数 1.1 rank()/dense_rank() 1.2 min()/max() 1.3 lead()/lag() 1.4 FIRST_VALUE/LAST_VALUE() 1.5 ROW_NUMBER() 1.6 sum/avg/count() 1.7 rows/range 2 其他 2.1 NULLS FIRST/LAST 2.2 NTILE(n) 2.3 keep(dense_rank first/last) 总结 1 over()分析函数 说明:聚合函数(如

  • Oracle中游标Cursor基本用法详解

    查询 SELECT语句用于从数据库中查询数据,当在PL/SQL中使用SELECT语句时,要与INTO子句一起使用,查询的 返回值被赋予INTO子句中的变量,变量的声明是在DELCARE中.SELECT INTO语法如下: SELECT [DISTICT|ALL]{*|column[,column,...]} INTO (variable[,variable,...] |record) FROM {table|(sub-query)}[alias] WHERE............ PL/SQL

  • Oracle中ROW_NUMBER()OVER()函数用法实例讲解

    目录 1. 说明: 2. 原理: 3.语法: 4.示例一: 5. 示例二 总结 Oracle中ROW_NUMBER() OVER()函数用法 1. 说明: ROW_NUMBER() OVER() 函数的作用:分组排序 2. 原理: row_number() over() 函数,over() 里的分组以及排序的执行晚于 where.group by.order by 的执行. 3.语法: row_number() over( partition by 分组列 order by 排序列 desc )

  • oracle中add_months()函数及用法总结

    今天对add_months函数进行简单总结一下: add_months 函数主要是对日期函数进行操作,在数据查询的过程中进行日期的按月增加,其形式为: add_months(date,int);其中第一个参数为日期,第二个为按月增加的幅度,例如: add_months (sysdate,2):就是当前日期的两个月之后的时间. 如:表示2个月以后的时间: SQL> select add_months(sysdate,2) from dual; ADD_MONTHS(SYSDATE,+2) ----

  • Oracle 中Contains 函数的用法

    1. 查询住址在北京的学生 SELECT student_id,student_name FROM students WHERE CONTAINS( address, 'beijing' ) remark: beijing是一个单词,要用单引号括起来. 2. 查询住址在河北省的学生 SELECT student_id,student_nameFROM students WHERE CONTAINS( address, '"HEIBEI province"' ) remark: HEBE

  • oracle中lpad函数的用法详解

    oracle中lpad的用法 pad翻译:填充 lpad函数,在字符串的左侧添加指定字符串,用法: www.jb51.net lpad(String ,截取长度,添加的字符串). 说是添加字符串也不准确,比较准确的说法是对String进行截取字符串, 如果截取长度大于String的长度,则在 String的左侧添加字符串进行填补,如果第三个参数未指定,则用空格进行填补. 例如: select lpad('test',10) from dual; 将返回" test" select lp

  • Oracle中游标Cursor的用法详解

    目录 一.使用游标 1.定义游标 2.打开游标 3.提取数据 4.关闭游标 5.游标属性 6.参数游标 二.for循环遍历,实现遍历游标最高效方式. 三.使用游标更新或删除数据 四.通过bulk collect减少loop处理的开销 五.使用游标变量 1.游标变量使用步骤 1.1定义ref cursor类型和游标变量 1.2打开游标 1.3提取游标数据 1.4关闭游标变量 2.游标变量使用示例 一.使用游标 对于DML语句和单行select into ,oracle自动分配隐形游标.处理sele

  • Oracle中PL/SQL的用法总结

    目录 一.PLSQL基本结构 1.基本数据类型变量 1. 基本数据类型 2. 基本数据类型变量的定义方法 2.表达式 1. 数值表达式 2. 字符表达式 3. 关系表达式 4. 逻辑表达式 3.PLSQL函数 4.系统输出打印 5.PL/SQL中的变量声明 二.变量赋值方式 三.PLSQL复合类型 1.记录类型record 2.表类型变量table 1. 定义一维表类型变量 2. 定义多维表类型变量 四. %type和%rowtype 五.PLSQL变量的可见空间 六.PLSQL流程控制 if判

  • Oracle中dbms_output.put_line的用法实例

    目录 1.enable: 2.disable: 3.put: 4.put_line: 5.new_line: 6.get_line(value, index): 7.get_lines(array, index): 总结 dbms_output.put_line的用法 涉及到的知识点如下: 1.enable: 在serveroutput on的情况下,用来使dbms_output生效(默认即打开) set serveroutput on --将output 服务打开 2.disable: 在se

  • oracle中decode函数的使用方法示例

    decode的几种用法 1:使用decode判断字符串是否一样 DECODE(value,if1,then1,if2,then2,if3,then3,...,else) 含义为 IF 条件=值1 THEN RETURN(value 1) ELSIF 条件=值2 THEN RETURN(value 2) ...... ELSIF 条件=值n THEN RETURN(value 3) ELSE RETURN(default) END IF sql测试 select empno,decode(empn

随机推荐