基本概念学习---XPath(XML路径语言)

时间 2020-03-19

原文原文链接

XPath即为XML路径语言，它是一种用来肯定XML（标准通用标记语言的子集）文档中某部分位置的语言。XPath基于XML的树状结构，提供在数据结构树中找寻节点的能力。起初 XPath 的提出的初衷是将其做为一个通用的、介于XPointer与XSLT间的语法模型。可是 XPath 很快的被开发者采用来看成小型查询语言。node

中文名数据结构
可扩展标记语言路径语言ide

外文名函数
Xml Path Language测试
外语缩写url
XPathspa

简介设计

XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中经过元素和属性进行导航。code

什么是 XPath?orm

XPath 使用路径表达式在 XML ^[1] 文档中进行导航

XPath 包含一个标准函数库

XPath 是 XSLT 中的主要元素

XPath 是一个 W3C 标准

含义

XPath 使用路径表达式在 XML 文档中进行导航

XPath 包含一个标准函数库

XPath 是 XSLT 中的主要元素

XPath 是一个 W3C 标准

语法

编辑

选取节点 XPath 使用路径表达式在 XML 文档中选取节点。节点是经过沿着路径或者 step 来选取的。

下面列出了最有用的路径表达式：

表达式	描述
nodename	选取此节点的全部子节点。
/	从根节点选取。
//	从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。
.	选取当前节点。
..	选取当前节点的父节点。
@	选取属性。

在下面的表格中，咱们已列出了一些路径表达式以及表达式的结果：

路径表达式	结果
bookstore	选取 bookstore 元素的全部子节点。
/bookstore	选取根元素 bookstore。注释：假如路径起始于正斜杠( / )，则此路径始终表明到某元素的绝对路径！
bookstore/book	选取属于 bookstore 的子元素的全部 book 元素。
//book	选取全部 book 子元素，而无论它们在文档中的位置。
bookstore//book	选择属于 bookstore 元素的后代的全部 book 元素，而无论它们位于 bookstore 之下的什么位置。
//@lang	选取名为 lang 的全部属性。

表达式

编辑

XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和咱们在常规的电脑文件系统中看到的表达式很是类似。路径表达式是从一个XML节点（当前的上下文节点）到另外一个节点、或一组节点的书面步骤顺序。这些步骤以“/”字符分开，每一步有三个构成成分：

轴描述（用最直接的方式接近目标节点）
节点测试（用于筛选节点位置和名称）
节点描述（用于筛选节点的属性和子节点特征）

通常状况下，咱们使用简写后的语法。虽然完整的轴描述是一种更加贴近人类语言，利用天然语言的单词和语法来书写的描述方式，可是相比之下也更加啰嗦。

运算符

编辑

下面列出了可用在 XPath 表达式中的运算符：

运算符	描述	实例	返回值
\|	计算两个节点集	//book \| //cd	返回全部拥有 book 和 cd 元素的节点集
+	加法	6 + 4	10
-	减法	6 - 4	2
*	乘法	6 * 4	24
div	除法	8 div 4	2
=	等于	price=9.80	若是 price 是 9.80，则返回 true。若是 price 是 9.90，则返回 false。
!=	不等于	price!=9.80	若是 price 是 9.90，则返回 true。若是 price 是 9.80，则返回 false。
<	小于	price<9.80	若是 price 是 9.00，则返回 true。若是 price 是 9.90，则返回 false。
<=	小于或等于	price<=9.80	若是 price 是 9.00，则返回 true。若是 price 是 9.90，则返回 false。
>	大于	price>9.80	若是 price 是 9.90，则返回 true。若是 price 是 9.80，则返回 false。
>=	大于或等于	price>=9.80	若是 price 是 9.90，则返回 true。若是 price 是 9.70，则返回 false。
or	或	price=9.80 or price=9.70	若是 price 是 9.80，则返回 true。若是 price 是 9.50，则返回 false。
and	与	price>9.00 and price<9.90	若是 price 是 9.80，则返回 true。若是 price 是 8.50，则返回 false。
mod	计算除法的余数	5 mod 2	1

标准函数

编辑

XPath 含有超过 100 个内建的函数。这些函数用于字符串值、数值，日期和时间比较、节点和 QName 处理、序列处理、逻辑值等等。

使用

编辑

XPath 是 XSLT 标准中的主要元素。若是没有 XPath 方面的知识，您就没法建立 XSLT 文档。

XQuery 和 XPointer 均构建于 XPath 表达式之上。XQuery 1.0 和 XPath 2.0 共享相同的数据模型，并支持相同的函数和运算符。

您能够在咱们的《XQuery 教程》中阅读更多有关 XQuery 的知识。

标准

编辑

XPath 于 1999年11月16日成为 W3C 标准。

XPath 被设计供 XSLT、XPointer 以及其余 XML 解析软件使用。

轴定义

编辑

轴可定义相对于当前节点的节点集。

轴名称	结果
ancestor	选取当前节点的全部先辈（父、祖父等）。
ancestor-or-self	选取当前节点的全部先辈（父、祖父等）以及当前节点自己。
attribute	选取当前节点的全部属性。
child	选取当前节点的全部子元素。
descendant	选取当前节点的全部后代元素（子、孙等）。
descendant-or-self	选取当前节点的全部后代元素（子、孙等）以及当前节点自己。
following	选取文档中当前节点的结束标签以后的全部节点。
namespace	选取当前节点的全部命名空间节点。
parent	选取当前节点的父节点。
preceding	选取文档中当前节点的开始标签以前的全部节点。
preceding-sibling	选取当前节点以前的全部同级节点。
self	选取当前节点。

每一个步均根据当前节点集之中的节点来进行计算。

步（step）包括：

轴（axis）
定义所选节点与当前节点之间的树关系
节点测试（node-test）
识别某个轴内部的节点
零个或者更多谓语（predicate）
更深刻地提炼所选的节点集

步的语法：

轴名称::节点测试[谓语]

实例

例子	结果
child::book	选取全部属于当前节点的子元素的 book 节点。
attribute::lang	选取当前节点的 lang 属性。
child::*	选取当前节点的全部子元素。
attribute::*	选取当前节点的全部属性。
child::text()	选取当前节点的全部文本子节点。
child::node()	选取当前节点的全部子节点。
descendant::book	选取当前节点的全部 book 后代。
ancestor::book	选择当前节点的全部 book 先辈。
ancestor-or-self::book	选取当前节点的全部 book 先辈以及当前节点（若是此节点是 book 节点）
child::*/child::price	选取当前节点的全部 price 孙节点。

节点关系

编辑

节点（Node）是XPath 的术语。

在 XPath 中，有七种类型的节点：元素、属性、文本、命名空间、处理指令、注释以及文档（根）节点。XML 文档是被做为节点树来对待的。树的根被称为文档节点或者根节点。^[2]

父（Parent）

每一个元素以及属性都有一个父。

在下面的例子中，book 元素是 title、author、year 以及 price 元素的父：

< book >

< title >HarryPotter</ title >

< author >JK.Rowling</ author >

< year >2005</ year >

< price >29.99</ price >

</ book >

子（Children）

元素节点可有零个、一个或多个子。

在下面的例子中，title、author、year 以及 price 元素都是 book 元素的子：

< book >

< title >HarryPotter</ title >

< author >JK.Rowling</ author >

< year >2005</ year >

< price >29.99</ price >

</ book >

同胞（Sibling）

拥有相同的父的节点

在下面的例子中，title、author、year 以及 price 元素都是同胞：

< book >

< title >HarryPotter</ title >

< author >JK.Rowling</ author >

< year >2005</ year >

< price >29.99</ price >

</ book >

先辈（Ancestor）

某节点的父、父的父，等等。

在下面的例子中，title 元素的先辈是 book 元素和 bookstore 元素：

< bookstore >

< book >

< title >HarryPotter</ title >

< author >JK.Rowling</ author >

< year >2005</ year >

< price >29.99</ price >

</ book >

</ bookstore >

后代（Descendant）

某个节点的子，子的子，等等。

在下面的例子中，bookstore 的后代是 book、title、author、year 以及 price 元素：

< bookstore >

< book >

< title >HarryPotter</ title >

< author >JK.Rowling</ author >

< year >2005</ year >

< price >29.99</ price >

</ book >

</ bookstore >

存取函数

名称说明

fn:node-name(node) 返回参数节点的节点名称。

fn:nilled(node) 返回是否拒绝参数节点的布尔值。

fn:data(item.item,...) 接受项目序列，并返回原子值序列。

fn:base-uri()

fn:base-uri(node)

返回当前节点或指定节点的 base-uri 属性的值。

fn:document-uri(node) 返回指定节点的 document-uri 属性的值。

语言升级

在 W3C 建议下，XPath 1.0于 1999年 11月16日发表。 XPath 2.0 目前正在W3C审核过程的最终阶段。XPath 2.0表达了XPath语言在大小与能力上显著的增长。

最值得一提的改变是XPath 2.0有了更丰富的型别系统；XPath 2.0支持不可分割型态，如在 XML Schema 内建型态定义同样，而且也可自纲要（schema）导入用户自定型别。如今每一个值都是一个序列（一个单一不可分割值或节点都被视为长度一的序列）。XPath 1.0节点组被节点序列取代，它能够是任何顺序。

为了支持更丰富的型别组，XPath 2.0提供至关延展的函式与操做子群。

XPath 2.0其实是 XQuery 1.0 的子集合。它提供了一个for表达式。该式是XQuery里“FLWOR”表达式的缩减版。利用列出XQuery省去的部分来描述该语言是可能的。主要范例是查询前导语（query prolog）、元素和属性建构式、“FLWOR”语法的余项式、以及typeswitch表达式。