dom4j特殊字符处理html
问题:java
最近在作项目时,遇到了解析xml问题。dom
使用dom4j解析xml信息时,若是属性值中包含&等特殊字符时,解析会提示以下异常:ide
java.lang.RuntimeException: 生成Document对象异常spa
1.dom4j解析xml:orm
通过查询得知dom4j在解析xml信息时,须要对一些特殊字符进行特殊处理:xml
下面是五个在XML文档中预约义好的实体:htm
< < 小于号对象
> > 大于号文档
& & 和
' ' 单引号
" " 双引号
好比你想输出“&”,那你的xml中要写成“&”,固然你这个值是写在属性里的,是value=""这样的形式。
2.dom4j生成xml:
在使用dom4j生成xml文件时,对于特殊字符“&”,总会自动生成"&",
所以在输入"<"或者">"时,<表明<,结果将&转成"&",就变成了"&lt;",
所以在使用xsl生成html时形成"<"没法正常使用,解决方法是:
在建立writer对象时操做以下:
XMLWriter writer = new XMLWriter(fmt); //以输出格式为参数建立xml输出对象
writer.setEscapeText(false);
这样&符号就不会被转义了。
请参阅dom4j文档
setEscapeText
public void setEscapeText(boolean escapeText)
Sets whether text output should be escaped or not. This is enabled by default. It could be disabled if the output format is textual, like in XSLT where we can have xml, html or text output.
Parameters:
escapeText - DOCUMENT ME!