SQL基础之XML

时间 2019-12-06

标签 sql 基础 xml 栏目 SQL 繁體版

原文原文链接

1.XML数据类型node

　　在SQL Server中xml数据类型能够用来保存xml文档，这个文档便可以是完整的xml文档和xml片断，这样开发者就能够像使用int数据类型同样来使用xml数据类型。不过xml数据类型是一种特殊的数据类型，它主要存在如下限制。
sql

（1）除了string数据类型外，没有其余数据类型可以转换为xml数据类型。xml数量列不可用于group by语句中。数据库

（2）xml列不得成为主键或外键的一部分，xml列不能指定为惟一的，可应用于xml列的内置标量函数只有isnull和coalesce。函数

（3）xml数据类型最多不能超过2gb，表中xml列不得超过32个，xml列不得加入到规则中。学习

2.XQueryspa

　　SQL Server为了更好的让开发者使用xml数据类型，因而便出现了xml查询语言XQuery，它能够查询结构化甚至是半结构化的xml数据。XQuery可以提供对xml数据的快速存储和查询，而且支持迭代以及对结果集进行排序等功能。下面是5个xml数据类型方法的sql语句。设计

use testDb declare @myxml xml set @myxml='<people> <student id="201301"> <Name>王五</Name> <Age>18</Age> <Address>湖南</Address> </student> <student id="201302"> <Name>李一</Name> <Age>20</Age> <Address>湖北</Address> </student> </people>'

--query(QueryString)函数
select @myxml.query('/people/student/Name') --结果: <Name>王五</Name><Name>李一</Name>
select @myxml.query(' for $ss in /people/student where $ss/Age[text()]<22 return element Res { (attribute age{data($ss/Age[text()[1]])}) }') --结果为: <Res age="18" /><Res age="20" />


/* value(QueryString,SQLType),该方法对xml执行XQuery查询,返回SQL类型的标量值。 参数QueryString：字符串类型的XQuery表达式，它检索xml实例中的数据而且最多只返回一个值，不然将返回错误 参数SQLType：要返回的首选SQL类型，SQLType不能是XML数据类型、公共语言运行时用户定义类型、image、text、ntext或sql_variant数据类型。但SQLType能够是用户定义数据类型 */
declare @result int
set @result=@myxml.value('(/people/student/@id)[1]','int') select @result 

/* exist(QueryString)方法, 它返回如下三种状况 1, 表示根据QueryString查询的结果集为非空,也就是说至少返回一个节点 0, 表示返回空结果集 null, 表示xml数据类型实例为null */
declare @ex xml --若是不对@ex赋值,此时@ex为null,那么返回的结果将为null --select @ex.exist('string') --返回NULL
set @ex=@myxml 
--函数true()和false()分别返回布尔值true和false，注意只要是非空那么就将返回1select @ex.exist('true()') --返回1select @ex.exist('false()') --返回1select @ex.exist('/people') --返回1select @ex.exist('/people/haha') --返回0select @ex.exist('/people/student[@id[1]="201301"]') --返回1select @ex.exist('/people/student[@id[1]="201303"]') --返回0


--modify(XML_DML),使用此方法能够修改xml数据内容 --参数XML_DML表示XML数据操做语言,它是一条字符串,最终将根据这个字符串来操做xml数据 --xml数据类型的modify方法只能在update语句的set字句中使用,注意若是是针对null值调用modify方法将返回错误
set @myxml.modify('replace value of (/people/student/@id)[1] with "201303" ') select @myxml  --此时第一个student节点的id将被改成201303


--语法: nodes(QueryString) as table(column), 若是要将xml数据类型拆分为关系数据,使用nodes方法将很是有效,它容许用户将标识映射到新行的节点 --参数QueryString: 若是查询表达式构造节点 --参数table(column): 结果行集的表名称和列名称 --得到全部student节点的数据,每一行显示一条student节点的数据
select T.c.query('.')  as result from @myxml.nodes('/people/student') as T(c) --将这些数据显示为一个表格
select T.c.value('(@id)[1]','int') as id, T.c.value('(./Name)[1]','nvarchar(16)') as name, T.c.value('(./Age)[1]','int') as age, T.c.value('(./Address)[1]','nvarchar(16)') as address from @myxml.nodes('/people/student') as T(c) --nodes的结果以下图

3.FOR XMLcode

　　经过使用for xml字句，咱们能够检索系统中表的数据并自动生成xml格式。for xml在在SQL Server里一共有4种模式：RAW、AUTO、EXPLICIT、PATH，for xml子句能够用在顶级查询和子查询中，顶级for xml子句只能出如今select语句中，子查询中的for xml子句能够出如今insert、delete、update以及赋值语句中。xml

　　raw和auto是比较简单易理解的2种模式，raw模式将为select语句所返回的查询结果集中的每一行转换为带有通用标记符<row>或可能提供元素名称的xml元素。默认状况下行集中非null的列都将映射为<row>元素的一个属性。这样当使用select查询时，会对结果集进行xml的转换，它们将会被转为row元素的属性。下面是关于for xml的sql介绍，raw模式是这4种模式里最简单的一种。auto模式也是返回xml数据，它与raw的区别在于返回的xml数据中，不是以raw做为元素节点名，而是使用表名做为元素名。这个是最明显的区别，除此以外，auto模式的结果集还能够造成简单的层次关系。blog

select teacherId,teacherName from teacher where teacherSex='女' for xml raw
--结果：<row teacherId="4" teacherName="谢一"/> -- <row teacherId="5" teacherName="罗二"/>
select teacherId,teacherName from teacher where teacherSex='女' for xml auto --结果：<teacher teacherId="4" teacherName="谢一"/> -- <teacher teacherId="5" teacherName="罗二"/>

select student.id,student.name,teacher.teacherId,teacher.teacherName from student inner join teacher on student.teacherId=teacher.teacherId --结果： 10 小李 1 王静 -- 11 小方 2 李四
select student.id,student.name,teacher.teacherId,teacher.teacherName 
from student inner join teacher on student.teacherId=teacher.teacherId for xml raw
--结果: <row id="10" name="小李 " teacherId="1" teacherName="王静" /> -- <row id="11" name="小方 " teacherId="2" teacherName="李四" />
select student.id,student.name,teacher.teacherId,teacher.teacherName 
from student inner join teacher on student.teacherId=teacher.teacherId for xml auto /* 生成了嵌套关系 <student id="10" name="小李 "> <teacher teacherId="1" teacherName="王静" /> </student> <student id="11" name="小方 "> <teacher teacherId="2" teacherName="李四" /> </student> */

　　explicit比较很差理解，我本身感受学sql和学C#是两个彻底不一样的思惟，sql学起来是一种有点难受的感受，而C#就算钻得很深也学得很爽。首先在数据这个角度看，使用explicit模式和使用auto模式都是相同的数据，并且也能够获得相同的层级效果。接下来就是explicit和auto最明显的区别，也能够说是explicit的优势，使用explicit模式的时候咱们能够以一种更加灵活的方式指定层级关系，而且能够本身指定元素的名称。固然explicit不像auto和raw那样就方便的加在语句后面，若是你这样作会报错："FOR XML EXPLICIT 要求第一列包含表明 XML 标记 ID 的正整数"或"FOR XML EXPLICIT要求第二列包含NULL或表明XML父标记ID的非负整数"。这2个错误中，若是第一列不为整数类型那就会出现第一个错误，若第一列为整数那就会出现第二个错误。总之，报错的本质就是缺乏2列数据，这2列数据正是错误中提示的“包含表明XML标记ID的正整数”和“包含NULL或表明XML父标记ID的非负整数”。XML标记ID指的是层级关系中，这段select所指定的层级。XML父标记则是你这个select层级的父级元素ID，这样根据标记ID和父标记ID来肯定这段结果在xml中的位置。

select distinct 1 as Tag, null as Parent, student.id as  [student!1!学生ID], student.name as [student!1!学生姓名], null as [teacher!2!老师ID], null as [teacher!2!老师姓名]
            from student,teacher where student.teacherId=teacher.teacherId union all
select 2 as Tag, 1 as parent, student.id, student.name, teacher.teacherId, teacher.teacherName from student,teacher where student.teacherId=teacher.teacherId

这是没有加for xml的查询结果，下面是添加了for xml explicit的sql和结果。

select distinct 1 as Tag, null as Parent, student.id as  [student!1!学生ID], student.name as [student!1!学生姓名], null as [teacher!2!老师ID], null as [teacher!2!老师姓名]
            from student,teacher where student.teacherId=teacher.teacherId union all
select 2 as Tag, 1 as parent, student.id, student.name, teacher.teacherId, teacher.teacherName from student,teacher where student.teacherId=teacher.teacherId for xml explicit

上面这段xml是根据第一个查询结果集生成的，如今最关键的疑问就是如何根据这些数据生成xml？首先要深入的记住生成xml时是按照结果集中的顺序一行一行开始生成的。因为第一行Parent为NULL也就是说第一行数据为顶级元素，所以执行完第一条结果集的时候此时xml中的内容为：

<student 学生ID="10" 学生姓名="小李 " 　　　　/>

接下来执行第二条结果集，此时仍然是顶级元素，因而又生成了一条xml节点，此时xml中的内容为：

<student 学生ID="10" 学生姓名="小李 " />
<student 学生ID="11" 学生姓名="小方 ">

接下来执行第三条结果集，如今Parent为1，Tag为2，说明这个结果集是Tag为1的子元素，因而便生成了teacher节点而且在上一个student父节点中，接下来又是一个子节点因而最终的效果就是添加了2个teacher节点而且这2个节点在第二个student父节点中：

<student 学生ID="10" 学生姓名="小李 " />
<student 学生ID="11" 学生姓名="小方 ">
  <teacher 老师ID="1" 老师姓名="王静" />
  <teacher 老师ID="2" 老师姓名="李四" />
</student>

可是，这个结果是错误的！由于是一个学生对应一个老师，而不是像显示xml结果中一个student包含2个teacher节点，致使这个现象产生的最主要因素就是我前面提到的顺序，xml的生成是根据结果集中的行数据一行一行生成的，为此咱们须要在结果集上进行一个排序。要达到的效果应该是下面这样的：

有了这个正确顺序的结果集，那么正确的xml就是这样的：

<student 学生ID="10" 学生姓名="小李 ">
  <teacher 老师ID="1" 老师姓名="王静" />
</student>
<student 学生ID="11" 学生姓名="小方 ">
  <teacher 老师ID="2" 老师姓名="李四" />
</student>

笔者是一个喜欢尝鲜的人，很巧，课本和msdn上举的都是2个层级的例子，学习过程当中在我学数据库建的表上也是写了2个select，因而我想尝试3个层级，sql以下。

select distinct 1 as Tag, null as Parent, student.id as  [student!1!学生ID], student.name as [student!1!学生姓名], null as [teacher!2!老师ID], null as [teacher!2!老师姓名], null as [地址!3!老师地址]
            from student,teacher where student.teacherId=teacher.teacherId union all
select 2 as Tag, 1 as parent, student.id, student.name, teacher.teacherId, teacher.teacherName, null
            from student,teacher where student.teacherId=teacher.teacherId union all
select 3 as Tag, 2 as parent, null, null, null, null, teacher.teacherAddress from student,teacher where student.teacherId=teacher.teacherId order by [student!1!学生ID],[teacher!2!老师ID]
            for xml explicit

这样写是有点问题的，由于order by那个地方是直接用的上面的order by字句，xml中的顺序应该会乱掉，但我没想到一执行就报错了。

错误提示意思是说我没有打开父标记ID2，刚开始我真不明白这个打开是什么意思，仔细揣摩错误提示后发现本质缘由了，下面是我不添加for xml的结果集，从中能够看到第一条数据tag为3，parent为2，此时xml文档中尚未生成ID为2的父节点，也就是说生成xml时必须已经存在父节点才能够继续生成，不然会报错。

因而我开始进行顺序设置，但试了多种老是不能够。让咱们再来观察这个结果集，若是要达到正确的效果那么tag为3的这2条数据应该是分别在2个tag为2的下面，但是tag为3的这一行只有地址这一列数据，不管怎么进行order by这2行数据都是挨着一块儿的，所以毫不可能达到正确的效果。

　　不过这让我对explicit的使用有一个更深入的体会，说实话它并非很好用，由于要获得正确的效果必须得有一个正确的顺序，而这个正确的顺序不只仅体如今order by字句里。在进行select时，顶级元素须要查找出部分数据，其他数据设置为null，在进行二级select时，应该在顶级元素查找的基础上增长二级元素所须要的，接着第三级元素应该在第二级元素的基础上增长第三级所须要查找的元素。这么作的缘由只有一个，就是进行order by时可以正确的排序，读到这里你是否已经想到如何设计才能让上面的结果集是一个正确的顺序呢？sql以下。

select distinct 1 as Tag, null as Parent, student.id as  [student!1!学生ID], student.name as [student!1!学生姓名], null as [teacher!2!老师ID], null as [teacher!2!老师姓名], null as [地址!3!老师地址]
            from student,teacher where student.teacherId=teacher.teacherId union all
select 2 as Tag, 1 as parent, student.id, student.name, teacher.teacherId, teacher.teacherName, null
            from student,teacher where student.teacherId=teacher.teacherId union all
select 3 as Tag, 2 as parent, student.id, student.name, teacher.teacherId, teacher.teacherName, teacher.teacherAddress from student,teacher where student.teacherId=teacher.teacherId order by [student!1!学生ID],[teacher!2!老师ID]
            for xml explicit

　　explicit虽然功能更增强大，可是使用起来须要写很长的sql而且还可能出错。为了解决这个问题四大模式中压轴的path模式就要出场了，在path中列名很重要，由于列名或列别名将被做为XPath表达式来处理，而这个表达式则指明了这一列在xml中位置。也就是说XPath表达式代替了explicit复杂的功能，只须要根据XPath中提供的类型、节点名称和层次结构便可生成具备层次结构的xml数据。使用path模式会自动为咱们生成的xml在原有顶级元素之上再添加一个顶级元素<row>，若是不想要这个顶级元素可在path中写上空字符串便可。具体的实现就如文件夹路径同样，咱们可以使用“/”来进行层级的指定，在这一条字符串中的最后一个字符串中，若是仅仅只是字符串即未添加“@”那么将会生成节点，若是添加“@”那么则表示是属性，固然关于path模式笔者也尚未研究完内容还有不少。具体sql以下，仍是实现上面的效果，可是使用的是极其简单方便的path模式。

select student.id as  'student/@学生ID', student.name as 'student/@学生姓名', teacher.teacherId as 'student/teacher/@老师ID', teacher.teacherName as 'student/teacher/@老师姓名', teacher.teacherAddress as 'student/teacher/地址/@老师地址'
       from student,teacher where student.teacherId=teacher.teacherId for xml path('')