PHP处理XML文档,没有CDATA部分数据处理

  在博客备份时,导出了全部文章,导出是xml文档,文章内容在CDATA部分。php

  这里介绍下XML中CDATA:框架

  全部 XML 文档中的文本均会被解析器解析。只有 CDATA 区段(CDATA section)中的文本会被解析器忽略。函数

  术语 CDATA 指的是不该由 XML 解析器进行解析的文本数据(Unparsed Character Data)。在 XML 元素中,"<" 和 "&" 是非法的。
  "<" 会产生错误,由于解析器会把该字符解释为新元素的开始。 "&" 也会产生错误,由于解析器会把该字符解释为字符实体的开始。
  某些文本,好比 JavaScript 代码,包含大量 "<" 或 "&" 字符。为了不错误,能够将脚本代码定义为 CDATA。
  CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束。spa

  XML格式以下:code

<description><![CDATA[<p> Laravel框架中间件使用</p> ]]></description>
<description><![CDATA[<p> 浮点数乘积之后取整,获得的数不符预期</p>]]></description>

   在用PHP处理函数  simplexml_load_file,处理该文档时,默认不包含CDATA数据部分。xml

  

<?php

$filename = 'xx';

$xml = simplexml_load_file($filename);// 无CDATA数据


$xml = simplexml_load_file($filename, null, LIBXML_NOCDATA);// 第三个参数便可
相关文章
相关标签/搜索