sp_xml_preparedocument _使用 处理XML文档

 

 

有时会在存储过程当中处理一些XML格式的数据,因此会用到sp_xml_preparedocument,他能够将XML数据进行读取,而后使用 MSXML 分析器 (Msxmlsql.dll) 对其进行分析。咱们就能够很容易的在存储过程当中获得XML中咱们想要的数据。下面的代码就是使用sp_xml_preparedocument读取XML:sql

DECLARE @hdoc int
DECLARE @doc varchar(1000)
SET @doc ='
<ROOT>
<Customer CustomerID="VINET" ContactName="Paul Henriot">
   <Order CustomerID="VINET" EmployeeID="5" OrderDate="1996-07-04T00:00:00">
      <OrderDetail OrderID="10248" ProductID="11" Quantity="12"/>
      <OrderDetail OrderID="10248" ProductID="42" Quantity="10"/>
   </Order>
</Customer>
<Customer CustomerID="LILAS" ContactName="Carlos Gonzlez">
   <Order CustomerID="LILAS" EmployeeID="3" OrderDate="1996-08-16T00:00:00">
      <OrderDetail OrderID="10283" ProductID="72" Quantity="3"/>
   </Order>
</Customer>
</ROOT>'

EXEC sp_xml_preparedocument @hdoc OUTPUT, @doc

上面只是读取了XML,要想获取XML数据还须要使用OPENXML,代码以下:架构

SELECT *
FROM openxml(@hdoc,'/ROOT/Customer',1)
WITH (CustomerID VARCHAR(40),ContactName VARCHAR(40)) 

OPENXML有三个参数:post

  • 第一个是sp_xml_preparedocument读取是的OUTPUT参数,在本示例中就是@hdoc;
  • 第二个是一个XPath表达式,用来获取指定位置的数据;
  • 第三个是一个可选项,用来表示获取的方式,有0,1,2,8四种取值,详细解释请看

FROM后面的WITH也是可选的,用来指定获取哪些数据字段,上面代码中只取了CustomerID和ContactName。上面的查询结果以下: CustomerID                               ContactName ---------------------------------------- ---------------------------------------- VINET   Paul Henriot LILAS                                    Carlos Gonzlez 若是不指定WITH子句,查询出来的是一个默认的表结构,以下:spa

表格列的解释说明:code

列名 数据类型 说明
id bigint 文档节点的惟一 ID。 根元素的 ID 值为 0。保留负 ID 值。
parentid bigint 标识节点的父节点。此 ID 标识的父节点不必定是父元素。具体状况取决于此 ID 所标识节点的子节点的节点类型。例如,若是节点为文本节点,则其父节点多是一个属性节点。 若是节点位于 XML 文档的顶层,则其 ParentID 为 NULL。
节点类型 int 标识节点类型,是对应于 XML 对象模型 (DOM) 节点类型编号的一个整数。 下列值是能够显示在此列中以指明节点类型的值: 1 = 元素节点 2 = 属性节点 3 = 文本节点 4 = CDATA 部分节点 5 = 实体引用节点 6 = 实体节点 7 = 处理指令节点 8 = 注释节点 9 = 文档节点 10 = 文档类型节点 11 = 文档片断节点 12 = 表示法节点 有关详细信息,请参阅 Microsoft XML (MSXML) SDK 中的“节点类型属性”主题。
localname nvarchar(max) 提供元素或属性的本地名称。若是 DOM 对象没有名称,则为 NULL。
prefix nvarchar(max) 节点名称的命名空间前缀。
namespaceuri nvarchar(max) 节点的命名空间 URI。若是值是 NULL,则命名空间不存在。
datatype nvarchar(max) 元素或属性行的实际数据类型,不然是 NULL。数据类型是从内联 DTD 中或从内联架构中推断得出。
prev bigint 前一个同级元素的 XML ID。若是前面没有同级元素,则为 NULL。
text ntext 包含文本形式的属性值或元素内容。若是边缘表项不须要值则为 NULL。

在WITH子句中,咱们还能够经过设置来获取父级元素的属性值:xml

DECLARE @hdoc int
DECLARE @doc varchar(1000)
SET @doc ='
<ROOT>
<Customer CustomerID="VINET" ContactName="Paul Henriot">
   <Order OrderID="10248" CustomerID="VINET" EmployeeID="5"
           OrderDate="1996-07-04T00:00:00">
      <OrderDetail ProductID="11" Quantity="12"/>
      <OrderDetail ProductID="42" Quantity="10"/>
   </Order>
</Customer>
<Customer CustomerID="LILAS" ContactName="Carlos Gonzlez">
   <Order OrderID="10283" CustomerID="LILAS" EmployeeID="3"
           OrderDate="1996-08-16T00:00:00">
      <OrderDetail ProductID="72" Quantity="3"/>
   </Order>
</Customer>
</ROOT>'

EXEC sp_xml_preparedocument @hdoc OUTPUT, @doc
SELECT *
FROM   OPENXML (@hdoc, '/ROOT/Customer/Order/OrderDetail',2)
         WITH (OrderID       int         '../@OrderID',
               CustomerID  varchar(10) '../@CustomerID',
               OrderDate   datetime    '../@OrderDate',
               ProdID      int         '@ProductID',
               Qty         int         '@Quantity')

查询的结果为: OrderID     CustomerID OrderDate               ProdID      Qty ----------- ---------- ----------------------- ----------- ----------- 10248       VINET      1996-07-04 00:00:00.000 11          12 10248       VINET      1996-07-04 00:00:00.000 42          10 10283       LILAS      1996-08-16 00:00:00.000 72          3 有时候XML中的数据并非以属性的方式存在,而是直接放在节点中,以下:对象

DECLARE @doc varchar(1000)
SET @doc ='
<ROOT>
<Customer CustomerID="VINET" ContactName="Paul Henriot">
   <Order>
     <OrderID>10248</OrderID>
     <CustomerID>VINET</CustomerID>
     <EmployeeID>5</EmployeeID>
     <OrderDate>1996-07-04T00:00:00</OrderDate>
   </Order>
</Customer>
</ROOT>'

此时要获Order节点下的各项的值,能够用下面方法:blog

DECLARE @hdoc int
DECLARE @doc varchar(1000)
SET @doc ='
<ROOT>
<Customer CustomerID="VINET" ContactName="Paul Henriot">
   <Order>
     <OrderID>10248</OrderID>
     <CustomerID>VINET</CustomerID>
     <EmployeeID>5</EmployeeID>
     <OrderDate>1996-07-04T00:00:00</OrderDate>
   </Order>
</Customer>
</ROOT>'

EXEC sp_xml_preparedocument @hdoc OUTPUT, @doc
SELECT *
FROM   OPENXML (@hdoc, '/ROOT/Customer/Order',1)
WITH (OrderID       int         'OrderID',
   CustomerID  varchar(10) 'CustomerID',
   EmployeeID   int    'EmployeeID',
   OrderDate      datetime         'OrderDate')

查询结果以下: OrderID     CustomerID EmployeeID  OrderDate ----------- ---------- ----------- ----------------------- 10248       VINET      5           1996-07-04 00:00:00.000 能够看出是取属性值仍是取节点的文本的值区别在于WITH子句的第三个参数是否有@符号ci

相关文章
相关标签/搜索