解析html时可能会须要某个节点的可见文本,而有时该节点下会嵌套不肯定的多个子/后代节点。html
<?xml version="1.0" encoding="UTF-8"?> <root> <tagA> <field>hello</field> <field><b>world</b></field> </tagA> </root>
取得tagA的可见文件,即"hello world"。函数
先取得tagA的html片断,再将片断中的标签过滤掉。测试
Document doc = Jsoup.parse(input); Elements ele = doc.getElementsByTag("tagA"); System.out.println(ele.text());
使用string函数code
string(arg) 返回参数的字符串值。参数能够是数字、逻辑值或节点。xml
所需xpath表达式htm
string(//tagA)