1.ROWNUM的使用——TOP-N分析oracle
使用SELECT语句返回的结果集,若但愿按特定条件查询前N条记录,可使用伪列ROWNUM。函数
ROWNUM是对结果集加的一个伪列,即先查到结果集以后再加上去的一个列 (强调:先要有结果集)。简单的说ROWNUM是符合条件结果的序列号。它老是从1开始排起的。测试
使用ROWNUM时,只能使用<、<=、!=符号。大数据
举例:排序
student(学生)表,表结构为:索引
ID char(6) --学号it
name VARCHAR2(10) --姓名table
--建表效率
create table student (ID char(6), name VARCHAR2(10));date
--添加测试记录
insert into student values('200001','张一');
insert into student values('200002','王二');
insert into student values('200003','李三');
insert into student values('200004','赵四');
commit;
--测试
SQL> select * from student;
ID NAME
------ ------------------------
200001 张一
200002 王二
200003 李三
200004 赵四
⑴ rownum 对于等于某值的查询条件
若是但愿找到学生表中第一条学生的信息,可使用rownum=1做为条件。可是想找到学生表中第二条学生的信息,使用rownum=2结果查不到数据。由于rownum都是从1开始,可是1以上的天然数在rownum作等于判断时认为都是false条件,因此没法查到rownum = n(n>1的天然数)。
SQL> select rownum,id,name from student where rownum=1;
ROWNUM ID NAME
---------- ------ ---------------------------------------------------
1 200001 张一
SQL> select rownum,id,name from student where rownum =2;
未选定行
⑵ rownum对于大于某值的查询条件
若是想找到从第二行记录之后的记录,当使用rownum>2是查不出记录的,缘由是因为rownum是一个老是从1开始的伪列,Oracle 认为rownum> n(n>1的天然数)这种条件依旧不成立,因此查不到记录。
SQL> select rownum,id,name from student where rownum >2;
未选定行
那如何才能找到第二行之后的记录呢?可使用子查询方法来解决。注意子查询中的rownum必需要有别名,不然仍是不会查出记录来,这是由于rownum不是某个表的列,若是不起别名的话,没法知道rownum是子查询的列仍是主查询的列。
SQL>select * from(select rownum no ,id,name from student) where no>2;
NO ID NAME
---------- ------ ---------------------------------------------------
3 200003 李三
4 200004 赵四
SQL> select * from(select rownum,id,name from student)where rownum>2;
未选定行
⑶ rownum对于小于某值的查询条件
若是想找到第三条记录之前的记录,当使用rownum<3是能获得两条记录的。显然rownum对于rownum<n(n>1的天然数)的条件认为是成立的,因此能够找到记录。
SQL> select rownum,id,name from student where rownum <3;
ROWNUM ID NAME
-------------------- ------ ---------------------------------------------------
1 200001 张一
2 200002 王二
综上几种状况,可能有时候须要查询rownum在某区间的数据,能够看出rownum对小于某值的查询条件是为true的,rownum对于大于某值的查询条件直接认为是false的,可是能够间接的让它转为认为是true的。那就必须使用子查询。例如要查询rownum在第二行到第三行之间的数据,包括第二行和第三行数据,那么咱们能够写如下语句,先让它返回小于等于3的记录行,而后在主查询中判断新的rownum的别名列大于等于2的记录行。可是这样的操做会在大数据集中影响速度。
SQL> select * from (select rownum no,id,name from student where rownum<=3 ) where no >=2;
NO ID NAME
---------- ------ ---------------------------------------------------
2 200002 王二
3 200003 李三
⑷ rownum和排序
Oracle中的rownum是在取数据的时候产生的序号,因此想对指定排序的数据指定rowmun行数据就必须注意了。
SQL> select rownum ,id,name from student order by name;
ROWNUM ID NAME
---------- ------ ---------------------------------------------------
3 200003 李三
2 200002 王二
1 200001 张一
4 200004 赵四
能够看出,rownum并非按照name列来生成的序号。系统是按照记录插入时的顺序给记录排的号,rowid也是顺序分配的。为了解决这个问题,必须使用子查询
SQL> select rownum ,id,name from (select * from student order by name);
ROWNUM ID NAME
---------- ------ ---------------------------------------------------
1 200003 李三
2 200002 王二
3 200001 张一
4 200004 赵四
这样就成了按name排序,而且用rownum标出正确序号(由小到大)。order by name 若是name是主键或有索引 ,查询出来的rownum彻底按照1,2,3.....的次序。
SQL> alter table student add constraint pk_stu primary key(name);
SQL> select rownum ,id,name from student order by name;
ROWNUM ID NAME
---------- ------ ---------------------------------------------------
1 200003 李三
2 200002 王二
3 200001 张一
4 200004 赵四
2. ROWID的使用——快速删除重复的记录
ROWID是数据的详细地址,经过rowid,oracle能够快速的定位某行具体的数据的位置。
ROWID能够分为物理rowid和逻辑rowid两种。普通的表中的rowid是物理rowid,索引组织表(IOT)的rowid是逻辑rowid。
当表中有大量重复数据时,可使用ROWID快速删除重复的记录。
举例:
--建表tbl
SQL> create table stu(no number,name varchar2(10),sex char(2));
--添加测试记录
SQL> insert into stu values(1, 'ab',’男’);
SQL> insert into stu values(1, 'bb',’女’);
SQL> insert into stu values(1, 'ab',’男’);
SQL> insert into stu values(1, 'ab',’男’);
SQL>commit;
删除重复记录方法不少,列出两种。
⑴ 经过建立临时表
能够把数据先导入到一个临时表中,而后删除原表的数据,再把数据导回原表,SQL语句以下:
SQL>create table stu_tmp as select distinct* from stu;
SQL>truncate table sut; //清空表记录
SQL>insert into stu select * from stu_tmp; //将临时表中的数据添加回原表
这种方法能够实现需求,可是很明显,对于一个千万级记录的表,这种方法很慢,在生产系统中,这会给系统带来很大的开销,不可行。
⑵ 利用rowid结合max或min函数
使用rowid快速惟一肯定重复行结合max或min函数来实现删除重复行。
SQL>delete from stu a where rowid not in (select max(b.rowid) from stu b where a.no=b.no and a.name = b.name and a.sex = b.sex); //这里max使用min也能够
或者用下面的语句
SQL>delete from stu a where rowid < (select max(b.rowid) from stu b where a.no=b.no and a.name = b.name and a.sex = b.sex); //这里若是把max换成min的话,前面的where子句中须要把"<"改成">"
跟上面的方法思路基本是同样的,不过使用了group by,减小了显性的比较条件,提升效率。
SQL>delete from stu where rowid not in (select max(rowid) from stu t group by t.no, t.name, t.sex );
思考:若在stu表中惟一肯定任意一行数据(1, 'ab',’男’),把sex字段更新为”女”,怎么作?
SQL>update stu set sex=’女’ where rowid=(select min(rowid) from stu where no=1 and name=’ab’ and sex=’男’);