xml学习笔记之二

形式良好的 XML 文档

“形式良好”或“结构良好”的 XML 文档拥有正确的语法。ide

“形式良好”(Well Formed)的 XML 文档会遵照前几章介绍过的 XML 语法规则:spa

  • XML 文档必须有根元素
  • XML 文档必须有关闭标签
  • XML 标签对大小写敏感
  • XML 元素必须被正确的嵌套
  • XML 属性必须加引号

 

在 XML 中有 5 个预约义的实体引用:

&lt; < 小于
&gt; > 大于
&amp; & 和号
&apos; ' 省略号
&quot; " 引号

注释:严格地讲,在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号和大于号是合法的,可是把它们替换为实体引用是个好的习惯。orm

 

CDATA

术语 CDATA 指的是不该由 XML 解析器进行解析的文本数据(Unparsed Character Data)。ip

在 XML 元素中,"<" 和 "&" 是非法的。文档

"<" 会产生错误,由于解析器会把该字符解释为新元素的开始。字符串

"&" 也会产生错误,由于解析器会把该字符解释为字符实体的开始。it

某些文本,好比 JavaScript 代码,包含大量 "<" 或 "&" 字符。为了不错误,能够将脚本代码定义为 CDATA。io

CDATA 部分中的全部内容都会被解析器忽略。table

CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束:function

<script>
<![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
  {
  return 1;
  }
else
  {
  return 0;
  }
}
]]>
</script>

在上面的例子中,解析器会忽略 CDATA 部分中的全部内容。

关于 CDATA 部分的注释:

CDATA 部分不能包含字符串 "]]>"。也不容许嵌套的 CDATA 部分。

标记 CDATA 部分结尾的 "]]>" 不能包含空格或折行。

相关文章
相关标签/搜索