存储树形结构数据是一个常见的问题,同时也有多种解决方案。node
这里介绍三种树形结构的表设计方案:数据库
邻接表模型bash
基于路径和层级的表设计函数
基于左右值编码的表设计(MPT)优化
这里以一个在线食品店做为例子,食品经过类别、颜色和品种组织食品。ui
示例以下:编码
最简单的方法就是使用邻接表模型或者叫作递归模型。经过显示地描述某一节点的父节点,从而可以创建二维的关系表,你只须要一个简单的函数去迭代查询便可获取你的数据。spa
示例以下:.net
优势:设计
设计简单
实现容易
直观
缺点:
在一的基础上加上一个 level 字段来表示当前节点到根节点的距离和一个 key 字段来表示搜索路径。
Node_id 主键
Name 名字
Parent_id 父节点的id
key 搜索路径
level 表示当前节点到根节点的距离或者层级
示例以下:
Node_id | Name | Parent_id | key | level |
---|---|---|---|---|
1 | Food | 0 | "" | 1 |
2 | Fruit | 1 | "1-" | 2 |
3 | Red | 2 | "1-2-" | 3 |
4 | Cherry | 3 | "1-2-3-" | 4 |
5 | Yellow | 2 | "1-2-" | 3 |
6 | Banana | 5 | "1-2-5-" | 4 |
7 | Meat | 1 | "1-" | 2 |
8 | Beef | 7 | "1-7-" | 3 |
9 | Pork | 7 | "1-7-" | 3 |
两种需求查询解决方案以下:
查找d的全部子孙节点:select * from table_name where key like "${d.key}-${d.id}-%"
查找某个节点的全部子节点:select * from table_name where key like "${d.key}-${d.id}-%" and level=${d.level}+1
此设计结构简单,利用key和level两个辅助字段能够完成查询操做比一更加高效,并且维护这两个字段成本很低。
为了不对于树形结构查询时的“递归”过程,基于Tree的前序遍历设计一种全新的无递归查询、无限分组的左右值编码方案,来保存该树的数据。
以下图所示, 从根节点Food左侧开始,标记为1,并沿前序遍历的方向,依次在遍历的路径上标注数字,最后咱们回到了根节点Food,并在右边写上了18。
注:lft 和 rgt 分别对应 DFS 的发现时间 d 和完成时间相同 f
若是咱们须要查询Fruit的后续节点,只需找出全部左值大于2,而且右值小于11的节点便可。
返回某节点子孙节点的前序遍历列表,以Fruit为例:
SQL: SELECT* FROM Tree WHERE Lft BETWEEN 2 AND 11 ORDER BY Lft ASC
查询结果以下:
那么某个节点到底有多少的子孙节点呢?
经过该节点的左、右值咱们能够将其子孙节点圈进来,则子孙总数 = (右值 – 左值– 1) / 2,以Fruit为例,其子孙总数为:(11 –2 – 1) / 2 = 4。
同时,为了更为直观地展示树形结构,咱们须要知道节点在树中所处的层次,经过左、右值的SQL查询便可实现。以Fruit为例:SELECT COUNT(*) FROM Tree WHERE Lft <= 2 AND Rgt >=11
。为了方便描述,咱们能够为Tree创建一个视图,添加一个层次数列,该列数值能够写一个自定义函数来计算,函数定义以下:
CREATE FUNCTION dbo.CountLayer
(
@node_id int
)
RETURNS int
AS
begin
declare @result int
set @result = 0
declare @lft int
declare @rgt int
if exists(select Node_id from Tree where Node_id = @node_id)
begin
select @lft = Lft, @rgt = Rgt from Tree where node_id = @node_id
select @result = count(*) from Tree where Lft <= @lft and Rgt >= @rgt
end
return @result
end
GO
复制代码
基于层次计算函数,咱们建立一个视图,添加了新的记录节点层次的数列:
CREATE VIEW dbo.TreeView
AS
SELECT Node_id, Name, Lft, Rgt, dbo.CountLayer(Node_id) AS Layer FROM dbo.Tree ORDER BY Lft
GO
复制代码
建立存储过程,用于计算给定节点的全部子孙节点及相应的层次:
CREATE PROCEDURE [dbo].[GetChildrenNodeList]
(
@node_id int
)
AS
declare @lft int
declare @rgt int
if exists(select Node_id from Tree where node_id = @node_id)
begin
select @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_id
select * from TreeView where Lft between @lft and @rgt order by Lft ASC
end
GO
复制代码
如今,咱们使用上面的存储过程来计算节点Fruit全部子孙节点及对应层次,查询结果以下:
在进行树的查询遍历时,只须要进行2次数据库查询,消除了递归,再加上查询条件都是数字的比较,查询的效率是极高的,随着树规模的不断扩大,基于左右值编码的设计方案将比传统的递归方案查询效率提升更多。
假定咱们要得到某节点的族谱路径,则根据左、右值分析只须要一条SQL语句便可完成。
以Fruit为例:SELECT* FROM Tree WHERE Lft < 2 AND Rgt > 11 ORDER BY Lft ASC
相对完整的存储过程以下:
CREATE PROCEDURE [dbo].[GetParentNodePath]
(
@node_id int
)
AS
declare @lft int
declare @rgt int
if exists(select Node_id from Tree where Node_id = @node_id)
begin
select @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_id
select * from TreeView where Lft < @lft and Rgt > @rgt order by Lft ASC
end
GO
复制代码
假定咱们要在节点“Red”下添加一个新的子节点“Apple”,该树将变成以下图所示,其中红色节点为新增节点。
相对完整的插入子节点的存储过程:
CREATE PROCEDURE [dbo].[AddSubNode]
(
@node_id int,
@node_name varchar(50)
)
AS
declare @rgt int
if exists(select Node_id from Tree where Node_id = @node_id)
begin
SET XACT_ABORT ON
BEGIN TRANSCTION
select @rgt = Rgt from Tree where Node_id = @node_id
update Tree set Rgt = Rgt + 2 where Rgt >= @rgt
update Tree set Lft = Lft + 2 where Lft >= @rgt
insert into Tree(Name, Lft, Rgt) values(@node_name, @rgt, @rgt + 1)
COMMIT TRANSACTION
SET XACT_ABORT OFF
end
GO
复制代码
若是咱们想要删除某个节点,会同时删除该节点的全部子孙节点,而这些被删除的节点的个数为:(被删除节点的右值 – 被删除节点的左值+ 1) / 2,而剩下的节点左、右值在大于被删除节点左、右值的状况下会进行调整。来看看树会发生什么变化,以Beef为例,删除效果以下图所示。
则咱们能够构造出相应的存储过程:
CREATE PROCEDURE [dbo].[DelNode]
(
@node_id int
)
AS
declare @lft int
declare @rgt int
if exists(select Node_id from Tree where Node_id = @node_id)
begin
SET XACT_ABORT ON
BEGIN TRANSCTION
select @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_id
delete from Tree where Lft >= @lft and Rgt <= @rgt
update Tree set Lft = Lft – (@rgt - @lft + 1) where Lft > @lft
update Tree set Rgt = Rgt – (@rgt - @lft + 1) where Rgt > @rgt
COMMIT TRANSACTION
SET XACT_ABORT OFF
end
GO
复制代码
优势:
消除了递归查询,实现了无限嵌套
查询是基于整数的比较,效率很高
缺点:
在基于数据库的通常应用中,查询的需求总要大于删除和修改,同时咱们能够扩展MPT来实现更多的优化,例如:若是对层级需求较高,能够结合MPT和二中的方法来实现。
参考文章: