xml学习总结

时间 2021-02-13

标签 css html 程序员 web 数据库 api tomcat 架构 dom 编码栏目 XML 繁體版

原文原文链接

1.概述

xml:extensiable markup language被称做可扩展性标记语言
xml简单的历史介绍：
gml->sgml->html->xml
gml(通用标记语言)-在不一样的机器上进行通讯的数据规范
sgml（标准通用标记语言）
html（超文本标记语言）css

１．咱们没有xml这种语言以前，咱们使用的是String做为两个程序之间的通信，可是String不擅长关系型结构的数据，描述起来会有歧义
２．html语言自己就有缺陷
    例如标记固定，没有真正实现国际化

xml就很好的解决了这些问题html

２．xml的用途

１．配置文件：例如tomcat的web.xml和server.xml,xml可以清楚地描述出程序之间的关系。
２．程序间数据的传输，xml的格式是通用的，可以减小交换数据时的复杂性。
３．充当小型数据库，若是咱们有时候须要人工配置的，那么xml充当小型数据库是个不错的选择，程序直接读取xml文件显然要比读取数据库要快。程序员

3.技术架构

xml数据或者xml文档只用于组织、存储数据，除此以外的数据生成、读取、传送等等操做都与xml自己无关。
因此，想要操做xml，就须要用到xml以外的技术了：
为xml定规则：如今通常使用DTD或者Schema技术。
解析xml的数据:通常使用DOM或者SAX技术，各有各的优势。
提供样式：xml通常用来存储数据，但设计者的野心很大，也想用来显示数据，就有了xslt（extensiable stylesheet language transformation）可扩展性样式语言。

4.xml语法

文档声明web

xml声明放在xml的第一行
version---版本
encoding--编码
standalone--独立使用--默认是no。standalone表示该xml是否是独立的，若是是yes，则表示这个xml文档是独立的，不能引用外部DTD规范文件；若是是no，则该xml文档不是独立的，表示能够引用外部的DTD规范文档。
正确的文档声明格式，属性的位置不能改变。
<?xml version="1.0" encoding="utf-8" standalone="no"?>

元素
首先在这里说明一个概念：在xml中元素和标签指的不是同一个东西，不要被不一样的名称锁迷惑了。
元素中须要值得注意的地方数据库

xml元素中的出现的空格和换行都会被当作元素内容进行处理。
每一个xml文档中必须有且只有一个根元素
元素必须闭合
大小写敏感
不能交叉嵌套
不能以数字开头

属性　api

<中国 name="china"></中国>

注释
CDATAtomcat

在编写xml文件时，有些内容可能不想让解析引擎解析执行，而是当作原始内容处理。遇到这种状况就可使用ＣＤＡＴＡ区
<![CDATA[
...内容
]]>

转义字符

处理指令
PI（processing instruction)。处理指令用来指挥解析引擎如何解析xml文档内容。
例如：架构

在xml文档中可使用xml-stylesheet指令，通知xml解析引擎，应用css文件显示xml文档内容。

<?xml-stylesheet type="text/css" href="1.css"?>

JDK中的xml APIdom

1.JAXP:主要负责解析xml
2.JAXB:主要负责将xml映射为Java对象

什么是xml解析编码

xml用于组织、存储数据，初次以外的数据生成、读取、传送等等的操做都与xml自己无关。

xml解析操做

１．dom(document object model)文档对象模型，是W3C组织推荐解析xml的一种方式
２．sax(simple api for xml)，它是xml社区的标准，几乎全部的xml解析器都支持它。

应用程序不是直接对xml文档进行操做的，而是由xml解析器对xml文档进行分析，而后应用程序经过对xml解析器所提供的dom接口或者sax接口对分析结果进行操做，从而间接地实现了对xml文档的访问！

DOM解析操做

DOM解析是一个基于对象的API，它把xml的内容加载到内存中，生成与xml文档内容对应的模型！当解析完成，内存中会生成与xml文档的结构与之对应的DOM对象树，这样就可以根据树的结构，以节点的形式对文档进行操做。
DOM解析会把xml文档加载到内存中，生成DOM树的元素都是以对象的形式存在的，咱们操做这些对象就可以操做xml文档了！

１．位于一个节点之上的节点是该节点的父节点（parent）
２．一个节点之下的节点是该节点的子节点（children）
３．同一个层次，具备相同父节点的节点是兄弟节点（sibling）
４．父、祖父节点及全部位于节点上面的，都是节点的祖先（ancestor）
在DOM解析中有几个核心的操做接口

１．Document--表明整个xml文档，经过Document节点能够访问xml文件中全部的元素内容
２．Node--Node节点几乎在xml操做接口中几乎至关于普通Java类的Object,不少核心接口都实现了它，在下面的关系图能够看出。
３．NodeList--表明一个节点的集合，一般是一个节点中节点的集合！
４．NameNodeMap--表示一组节点和其惟一名称对应的一一对应关系，主要用于属性节点的表示

###SAX解析

SAX采用的是一种顺序的模式进行访问，是一种快速读取xml数据的方式。当时候sax解析器进行操做时，会触发一系列事件SAX。采用事件处理的方式解析XML文件，利用SAX解析xml文档，涉及两个部分：解析器和事件处理器。
sax是一种推式的机制，你建立一个sax解析器，解析器在发现xml文档中的内容就告诉你。如何处理，由程序员决定。

DOM和SAX解析的区别

dom--内存中dom树，若是文档过大，致使溢出。
sax--部分读取，能够处理大文件，只能对文件按顺序从头至尾解析一遍，不支持增删该查。

dom4j

就是为了客服dom和sax缺点

１．获取

//获取到解析器
SAXReader saxReader = new SAXReader();

//获取到XML文件的流对象
InputStream inputStream = DOM4j.class.getClassLoader().getResourceAsStream("1.xml");

//经过解析器读取XML文件
Document document = saxReader.read(inputStream);

2.获取Document对象

１．读取xml文件，得到document对象

SAXReader reader = new SAXReader()；
Document document = reader.read(new File("input.xml"));

２．解析xml形式的文本，获得document对象

String text = "<members></members>";
Document document=DocumentHelper.parseText(text);

３．主动建立document对象

Document document =DocumentHelper.createDocument();

//建立根节点
Element root = document.addElement("members");

XPATH

能够帮助咱们更加方便地得到xml的节点。