Xpath 是一种用在 XML 文档中定位元素的语言,一样也支持 HTML 元素的解析。ide
所谓 Xpath,是指 XML path language。path 就是路径,那么 Xpath 主要是经过路径来查找元素。code
咱们经过下面一张小图来了解一下 HTML 中的结构:orm
HTML 的结构就是树形结构,HTML 是根节点,全部的其余元素节点都是从根节点发出的。其余的元素都是这棵树上的节点
Node
,每一个节点还可能有属性和文本。
而路径就是指某个节点到另外一个节点的路线。blog节点之间存在各类关系:文档
- 父节点(Parent): HTML 是 body 和 head 节点的父节点;
- 子节点(Child):head 和 body 是 HTML 的子节点;
- 兄弟节点(Sibling):拥有相同的父节点,head 和 body 就是兄弟节点。title 和 div 不是兄弟,由于他们不是同一个父节点。
- 祖先节点(Ancestor):body 是 form 的祖先节点,爷爷辈及以上