使用xpath取得节点的text

解析html时可能会须要某个节点的可见文本,而有时该节点下会嵌套不肯定的多个子/后代节点。html

测试输入

<?xml version="1.0" encoding="UTF-8"?>
<root>
	<tagA>
		<field>hello</field>
		<field><b>world</b></field>
	</tagA>
</root>

目标

取得tagA的可见文件,即"hello world"。函数

解决方案

1.折中方案

先取得tagA的html片断,再将片断中的标签过滤掉。测试

2.jsoup

Document doc = Jsoup.parse(input);
      Elements ele = doc.getElementsByTag("tagA");
      System.out.println(ele.text());

3.xpath

使用string函数code

string(arg) 返回参数的字符串值。参数能够是数字、逻辑值或节点。xml

所需xpath表达式htm

string(//tagA)
相关文章
相关标签/搜索