Oracle 树操做、递归查询(select…start with…connect by…prior)

1、Oracle中start with…connect by prior子句用法

connect by 是结构化查询中用到的,其基本语法是:
select … from tablename
start with 条件1
connect by 条件2
where 条件3;

例:
select * from table
start with org_id = ‘HBHqfWGWPy’
connect by prior org_id = parent_id;

         简单说来是将一个树状结构存储在一张表里,好比一个表中存在两个字段:
org_id,parent_id那么经过表示每一条记录的parent是谁,就能够造成一个树状结构。
        用上述语法的查询能够取得这棵树的全部记录。
        其中:
        条件1 是根结点的限定语句,固然能够放宽限定条件,以取得多个根结点,实际就是多棵树。
        条件2 是链接条件,其中用 PRIOR表示上一条记录,好比  CONNECT BY  PRIOR org_id = parent_id;就是说 上一条记录的org_id 是本条记录的parent_id,即本记录的父亲是上一条记录。
         条件3 是过滤条件,用于对返回的全部记录进行过滤。

        简单介绍以下:
        在扫描树结构表时,须要依此访问树结构的每一个节点,一个节点只能访问一次,其访问的步骤以下:
        第一步:从根节点开始;
        第二步:访问该节点;
        第三步:判断该节点有无未被访问的子节点,如有,则转向它最左侧的未被访问的子节,并执行第二步,不然执行第四步;
        第四步:若该节点为根节点,则访问完毕,不然执行第五步;
        第五步:返回到该节点的父节点,并执行第三步骤。
        总之:扫描整个树结构的过程也便是 中序遍历树的过程。

 1.树结构的描述
        树结构的数据存放在表中,数据之间的层次关系即父子关系,经过表中的列与列间的关系来描述,如EMP表中的EMPNO和MGR。EMPNO表示该雇员的编号,MGR表示领导该雇员的人的编号,即子节点的MGR值等于父节点的EMPNO值。在表的每一行中都有一个表示父节点的MGR(除根节点外),经过每一个节点的父节点,就能够肯定整个树结构。
         在SELECT命令中使用CONNECT BY 和START WITH 子句能够查询表中的树型结构关系。其命令格式以下:
SELECT . . .
CONNECT BY {PRIOR 列名1=列名2|列名1=PRIOR 裂名2}
[START WITH];

       其中:CONNECT BY子句说明每行数据将是按层次顺序检索,并规定将表中的数据连入树型结构的关系中。PRIOR运算符必须放置在链接关系的两列中某一个的前面。对于节点间的父子关系, PRIOR运算符在一侧表示父节点,在另外一侧表示子节点,从而肯定查找树结构是的顺序是自顶向下仍是自底向上
         在链接关系中,除了可使用列名外,还容许使用列表达式。START WITH 子句为可选项,用来标识哪一个节点做为查找树型结构的根节点。若该子句被省略,则表示全部知足查询条件的行做为根节点。
         START WITH:不但能够指定一个根节点,还能够指定多个根节点。

2.关于PRIOR
        运算符PRIOR被放置于等号先后的位置,决定着查询时的检索顺序。
        PRIOR被置于CONNECT BY子句中等号的前面时,则强制从根节点到叶节点的顺序检索,即由父节点向子节点方向经过树结构,咱们称之为自顶向下的方式。如:
         CONNECT BY PRIOR EMPNO=MGR
         PIROR运算符被置于CONNECT BY 子句中等号的后面时,则强制从叶节点到根节点的顺序检索,即由子节点向父节点方向经过树结构,咱们称之为自底向上的方式。例如:
         CONNECT BY EMPNO=PRIOR MGR
         在这种方式中也应指定一个开始的节点。

3.定义查找起始节点
        在自顶向下查询树结构时,不但能够从根节点开始,还能够定义任何节点为起始节点,以此开始向下查找。这样查找的结果就是以该节点为开始的结构树的一枝。

4.使用LEVEL
        在具备树结构的表中,每一行数据都是树结构中的一个节点,因为节点所处的层次位置不一样,因此每行记录均可以有一个层号。层号根据节点与根节点的距离肯定。不论从哪一个节点开始,该起始根节点的层号始终为1,根节点的子节点为2, 依此类推。图1.2就表示了树结构的层次。

5.节点和分支的裁剪
         在对树结构进行查询时,能够去掉表中的某些行,也能够剪掉树中的一个分支,使用WHERE子句来限定树型结构中的单个节点,以去掉树中的单个节点,但它却不影响其后代节点(自顶向下检索时)或前辈节点(自底向顶检索时)。

6.排序显示
         象在其它查询中同样,在树结构查询中也可使用ORDER BY 子句,改变查询结果的显示顺序,而没必要按照遍历树结构的顺序。
 
2、例子
 

一、准备测试表和测试数据java

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
--菜单目录结构表
create  table  tb_menu(
   id     number(10) not  null , --主键id
   title  varchar2(50), --标题
   parent number(10) --parent id
)
 
--父菜单
insert  into  tb_menu(id, title, parent) values (1, '父菜单1' , null );
insert  into  tb_menu(id, title, parent) values (2, '父菜单2' , null );
insert  into  tb_menu(id, title, parent) values (3, '父菜单3' , null );
insert  into  tb_menu(id, title, parent) values (4, '父菜单4' , null );
insert  into  tb_menu(id, title, parent) values (5, '父菜单5' , null );
--一级菜单
insert  into  tb_menu(id, title, parent) values (6, '一级菜单6' ,1);
insert  into  tb_menu(id, title, parent) values (7, '一级菜单7' ,1);
insert  into  tb_menu(id, title, parent) values (8, '一级菜单8' ,1);
insert  into  tb_menu(id, title, parent) values (9, '一级菜单9' ,2);
insert  into  tb_menu(id, title, parent) values (10, '一级菜单10' ,2);
insert  into  tb_menu(id, title, parent) values (11, '一级菜单11' ,2);
insert  into  tb_menu(id, title, parent) values (12, '一级菜单12' ,3);
insert  into  tb_menu(id, title, parent) values (13, '一级菜单13' ,3);
insert  into  tb_menu(id, title, parent) values (14, '一级菜单14' ,3);
insert  into  tb_menu(id, title, parent) values (15, '一级菜单15' ,4);
insert  into  tb_menu(id, title, parent) values (16, '一级菜单16' ,4);
insert  into  tb_menu(id, title, parent) values (17, '一级菜单17' ,4);
insert  into  tb_menu(id, title, parent) values (18, '一级菜单18' ,5);
insert  into  tb_menu(id, title, parent) values (19, '一级菜单19' ,5);
insert  into  tb_menu(id, title, parent) values (20, '一级菜单20' ,5);
--二级菜单
insert  into  tb_menu(id, title, parent) values (21, '二级菜单21' ,6);
insert  into  tb_menu(id, title, parent) values (22, '二级菜单22' ,6);
insert  into  tb_menu(id, title, parent) values (23, '二级菜单23' ,7);
insert  into  tb_menu(id, title, parent) values (24, '二级菜单24' ,7);
insert  into  tb_menu(id, title, parent) values (25, '二级菜单25' ,8);
insert  into  tb_menu(id, title, parent) values (26, '二级菜单26' ,9);
insert  into  tb_menu(id, title, parent) values (27, '二级菜单27' ,10);
insert  into  tb_menu(id, title, parent) values (28, '二级菜单28' ,11);
insert  into  tb_menu(id, title, parent) values (29, '二级菜单29' ,12);
insert  into  tb_menu(id, title, parent) values (30, '二级菜单30' ,13);
insert  into  tb_menu(id, title, parent) values (31, '二级菜单31' ,14);
insert  into  tb_menu(id, title, parent) values (32, '二级菜单32' ,15);
insert  into  tb_menu(id, title, parent) values (33, '二级菜单33' ,16);
insert  into  tb_menu(id, title, parent) values (34, '二级菜单34' ,17);
insert  into  tb_menu(id, title, parent) values (35, '二级菜单35' ,18);
insert  into  tb_menu(id, title, parent) values (36, '二级菜单36' ,19);
insert  into  tb_menu(id, title, parent) values (37, '二级菜单37' ,20);
--三级菜单
insert  into  tb_menu(id, title, parent) values (38, '三级菜单38' ,21);
insert  into  tb_menu(id, title, parent) values (39, '三级菜单39' ,22);
insert  into  tb_menu(id, title, parent) values (40, '三级菜单40' ,23);
insert  into  tb_menu(id, title, parent) values (41, '三级菜单41' ,24);
insert  into  tb_menu(id, title, parent) values (42, '三级菜单42' ,25);
insert  into  tb_menu(id, title, parent) values (43, '三级菜单43' ,26);
insert  into  tb_menu(id, title, parent) values (44, '三级菜单44' ,27);
insert  into  tb_menu(id, title, parent) values (45, '三级菜单45' ,28);
insert  into  tb_menu(id, title, parent) values (46, '三级菜单46' ,28);
insert  into  tb_menu(id, title, parent) values (47, '三级菜单47' ,29);
insert  into  tb_menu(id, title, parent) values (48, '三级菜单48' ,30);
insert  into  tb_menu(id, title, parent) values (49, '三级菜单49' ,31);
insert  into  tb_menu(id, title, parent) values (50, '三级菜单50' ,31);
commit ;
 
select  * from  tb_menu;

parent字段存储的是上级id,若是是顶级父节点,该parent为null(得补充一句,当初的确是这样设计的,不过如今知道,表中最好别有null记录,这会引发全文扫描,建议改为0代替)。sql

二、树操做
咱们从最基本的操做,逐步列出树查询中常见的操做,全部查询出来的节点以家族中的辈份做比方。数据库

1)、查找树中的全部顶级父节点(辈份最长的人)。 假设这个树是个目录结构,那么第一个操做老是找出全部的顶级节点,再根据该节点找到其下属节点。oracle

1
select * from tb_menu m where m.parent is null ;

2)、查找一个节点的直属子节点(全部儿子)。 若是查找的是直属子类节点,也是不用用到树型查询的。函数

1
select * from tb_menu m where m.parent= 1 ;

3)、查找一个节点的全部直属子节点(全部后代)。测试

1
select * from tb_menu m start with m.id= 1  connect by m.parent=prior m.id;

这个查找的是id为1的节点下的全部直属子类节点,包括子辈的和孙子辈的全部直属节点。spa

4)、查找一个节点的直属父节点(父亲)。 若是查找的是节点的直属父节点,也是不用用到树型查询的。设计

1
2
3
4
--c-->child, p->parent
select c.id, c.title, p.id parent_id, p.title parent_title
from tb_menu c, tb_menu p
where c.parent=p.id and c.id= 6

5)、查找一个节点的全部直属父节点(祖宗)。code

1
select * from tb_menu m start with m.id= 38  connect by prior m.parent=m.id;

这里查找的就是id为1的全部直属父节点,打个比方就是找到一我的的父亲、祖父等。可是值得注意的是这个查询出来的结果的顺序是先列出子类节点再列出父类节点,姑且认为是个倒序吧。排序

上面列出两个树型查询方式,第3条语句和第5条语句,这两条语句之间的区别在于prior关键字的位置不一样,因此决定了查询的方式不一样。 当parent = prior id时,数据库会根据当前的id迭代出parent与该id相同的记录,因此查询的结果是迭代出了全部的子类记录;而prior parent = id时,数据库会跟据当前的parent来迭代出与当前的parent相同的id的记录,因此查询出来的结果就是全部的父类结果。

如下是一系列针对树结构的更深层次的查询,这里的查询不必定是最优的查询方式,或许只是其中的一种实现而已。

6)、查询一个节点的兄弟节点(亲兄弟)。

1
2
3
--m.parent=m2.parent-->同一个父亲
select * from tb_menu m
where exists (select * from tb_menu m2 where m.parent=m2.parent and m2.id= 6 )

7)、查询与一个节点同级的节点(族兄弟)。 若是在表中设置了级别的字段,那么在作这类查询时会很轻松,同一级别的就是与那个节点同级的,在这里列出不使用该字段时的实现!

1
2
3
4
5
6
7
8
with tmp as(
       select a.*, level leaf       
       from tb_menu a               
       start with a.parent is null     
       connect by a.parent = prior a.id)
select *                              
from tmp                            
where leaf = (select leaf from tmp where id = 50 );

这里使用两个技巧,一个是使用了level来标识每一个节点在表中的级别,还有就是使用with语法模拟出了一张带有级别的临时表。

8)、查询一个节点的父节点的的兄弟节点(伯父与叔父)。          

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
with tmp as(
     select tb_menu.*, level lev
     from tb_menu
     start with parent is null
     connect by parent = prior id)
    
select b.*
from tmp b,(select *
             from tmp
             where id = 21  and lev = 2 ) a
where b.lev = 1
 
union all
 
select *
from tmp
where parent = (select distinct x.id
                 from tmp x, --祖父
                      tmp y, --父亲
                      (select *
                       from tmp
                       where id = 21  and lev > 2 ) z --儿子
                 where y.id = z.parent and x.id = y.parent);

这里查询分红如下几步。
首先,将第7个同样,将全表都使用临时表加上级别;
其次,根据级别来判断有几种类型,以上文中举的例子来讲,有三种状况:
(1)当前节点为顶级节点,即查询出来的lev值为1,那么它没有上级节点,不予考虑。
(2)当前节点为2级节点,查询出来的lev值为2,那么就只要保证lev级别为1的就是其上级节点的兄弟节点。
(3)其它状况就是3以及以上级别,那么就要选查询出来其上级的上级节点(祖父),再来判断祖父的下级节点都是属于该节点的上级节点的兄弟节点。
最后,就是使用union将查询出来的结果进行结合起来,造成结果集。

9)、查询一个节点的父节点的同级节点(族叔)。
这个其实跟第7种状况是相同的。

1
2
3
4
5
6
7
8
with tmp as(
       select a.*, level leaf       
       from tb_menu a               
       start with a.parent is null     
       connect by a.parent = prior a.id)
select *                              
from tmp                            
where leaf = (select leaf from tmp where id = 6 ) - 1 ;

基本上,常见的查询在里面了,不常见的也有部分了。其中,查询的内容都是节点的基本信息,都是数据表中的基本字段,可是在树查询中还有些特殊需求,是对查询数据进行了处理的,常见的包括列出树路径等。

补充一个概念,对于数据库来讲,根节点并不必定是在数据库中设计的顶级节点,对于数据库来讲,根节点就是start with开始的地方。

下面列出的是一些与树相关的特殊需求。

10)、名称要列出名称所有路径。
这里常见的有两种状况,一种是从顶级列出,直到当前节点的名称(或者其它属性);一种是从当前节点列出,直到顶级节点的名称(或其它属性)。举地址为例:国内的习惯是从省开始、到市、到县、到居委会的,而国外的习惯正好相反(老师说的,还没接过国外的邮件,谁能寄个瞅瞅  )。
从顶部开始:

1
2
3
4
5
select sys_connect_by_path (title, '/' )
from tb_menu
where id = 50
start with parent is null
connect by parent = prior id;

从当前节点开始:

1
2
3
4
select sys_connect_by_path (title, '/' )
from tb_menu
start with id = 50
connect by prior parent = id;

在这里我又不得不放个牢骚了。oracle只提供了一个sys_connect_by_path函数,却忘了字符串的链接的顺序。在上面的例子中,第一个sql是从根节点开始遍历,而第二个sql是直接找到当前节点,从效率上来讲已是千差万别,更关键的是第一个sql只能选择一个节点,而第二个sql倒是遍历出了一颗树来。再次ps一下。

sys_connect_by_path函数就是从start with开始的地方开始遍历,并记下其遍历到的节点,start with开始的地方被视为根节点,将遍历到的路径根据函数中的分隔符,组成一个新的字符串,这个功能仍是很强大的。

11)、列出当前节点的根节点。
在前面说过,根节点就是start with开始的地方。

1
2
3
4
select connect_by_root title, tb_menu.*
from tb_menu
start with id = 50
connect by prior parent = id;

connect_by_root函数用来列的前面,记录的是当前节点的根节点的内容。

12)、列出当前节点是否为叶子。
这个比较常见,尤为在动态目录中,在查出的内容是否还有下级节点时,这个函数是很适用的。

1
2
3
4
select connect_by_isleaf, tb_menu.*
from tb_menu
start with parent is null
connect by parent = prior id;

connect_by_isleaf函数用来判断当前节点是否包含下级节点,若是包含的话,说明不是叶子节点,这里返回0;反之,若是不包含下级节点,这里返回1。

至此,oracle树型查询基本上讲完了,以上的例子中的数据是使用到作过的项目中的数据,由于里面的内容可能很差理解,因此就所有用一些新的例子来进行阐述。以上全部sql都在本机上测试经过,也都能实现相应的功能,可是并不能保证是解决这类问题的最优方案(如第8条明显写成存储过程会更好).

相关文章
相关标签/搜索