“形式良好”或“结构良好”的 XML 文档拥有正确的语法。ide
“形式良好”(Well Formed)的 XML 文档会遵照前几章介绍过的 XML 语法规则:spa
< | < | 小于 |
> | > | 大于 |
& | & | 和号 |
' | ' | 省略号 |
" | " | 引号 |
注释:严格地讲,在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号和大于号是合法的,可是把它们替换为实体引用是个好的习惯。orm
术语 CDATA 指的是不该由 XML 解析器进行解析的文本数据(Unparsed Character Data)。ip
在 XML 元素中,"<" 和 "&" 是非法的。文档
"<" 会产生错误,由于解析器会把该字符解释为新元素的开始。字符串
"&" 也会产生错误,由于解析器会把该字符解释为字符实体的开始。it
某些文本,好比 JavaScript 代码,包含大量 "<" 或 "&" 字符。为了不错误,能够将脚本代码定义为 CDATA。io
CDATA 部分中的全部内容都会被解析器忽略。table
CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束:function
<script> <![CDATA[ function matchwo(a,b) { if (a < b && a < 0) then { return 1; } else { return 0; } } ]]> </script>
在上面的例子中,解析器会忽略 CDATA 部分中的全部内容。
CDATA 部分不能包含字符串 "]]>"。也不容许嵌套的 CDATA 部分。
标记 CDATA 部分结尾的 "]]>" 不能包含空格或折行。