3二、XML

XMLcss

概念:可扩展标记语言,标签都是自定义html

功能:存储数据网络

            一、配置文件dom

            二、在网络中传输工具

XML和HTML的区别:一、xml标签都是自定义的,html标签都是预约义的编码

                              二、xml的语法严格,html语法松散url

                              三、xml是存储数据的,html是展现数据的操作系统

 

语法:一、xml文档的后缀名 .xmlxml

         二、xml第一行必须定义为文档声明 <? xml version = '1.0' ?>htm

         三、xml文档中有且仅有一个根标签

         四、属性值必须使用引号(单双均可)引发来

         五、标签必须正确关闭

         六、xml标签名称区分大小写

 

组成部分:一、文档声明

                        格式:<? xml 属性列表 ?>

                        属性列表:version:版本号,必须属性

                                       encoding:编码方式,告知解析引擎当前文档使用的字符集,默认值:ISO-8859-1

                                       standalone:是否独立,取值yes , no

               二、指令

                        结合css

               三、标签

                        标签名称自定义规则:一、名称能够包含字母、数字以及其余的字符

                                                      二、名称不能以数字或者标点符号开始

                                                      三、名称不能以字母xml(Xml,Xml等等)开始

                                                      四、名称不能包含空格

               四、属性

                        id属性值惟一

               五、文本

                        CDATA区:在该区域中的数据会被原样展现

                        格式:<![CDATA][ 数据 ]>

 

XML的约束:规定xml文档的书写规则

分类:DTD:一种简单的约束技术

         Schema:一种复杂的约束技术

DTD:引入dtd文档到xml文档中

          内部dtd:将约束规则定义在xml文档中

                        <! DOCTYPE  根标签名 [约束内容]>

          外部dtd:将约束的规则定义在外部的dtd文件中

                        本地:<! DOCTYPE 根标签名 SYSTEM “dtd文件的位置”>

                        网络:<! DOCTYPE 根标签名 PUBLIC “dtd文件名字”“dtd文件的位置URL”>

Schema:

        引入:一、填写xml文档的根目录

                 二、引入xsi前缀

                 三、引入xsd文件的命名空间

                 四、为每一个xsd约束声明一个前缀

 

XML的解析:

          读取:将文档中的数据读取到内存中

          写入:将内存中的数据保存到xml文档中,持久化存储

         

         方式:

                    一、DOM:将标记语言文档一次性加载进内存,在内存中造成一棵DOM树

                            优势:操做方便,能够对文档进行CRUD的全部操做

                            缺点:占内存

                    二、SAX:逐行读取,基于事件驱动

                            优势:不占内存

                            缺点:只能读取,不能增删改

xml常见的解析器:

                一、JAXP:sun公司提供的解析器,支持dom和sax思想

                二、DOM4J:一款很是优秀的解析器

                三、Jsoup:Java的HTML解析器

                四、PULL:安卓操做系统内置的解析器,sax方式

Jsoup:

     使用步骤:一、导入jar包

                    二、获取document对象

                    三、获取对应标签的Element 对象

                    四、获取数据

     对象的使用:一、Jsoup:工具类,能够解析html或xml文档,返回Document

                                  方法:parse:解析html或xml文档,返回Document

                                           parse(File in,string charsetName):解析xml或html文件的

                                            parse(String html):解析xml或html字符串

                                           parse(URL url,int timeoutMillis):经过网络路径获取指定的html或xml的文档对象

                        二、Document:

                                    一、获取Element:

                                    getElementById(String id):根据id属性值获取惟一的element对象

                                    getElementsByTag(String tagName):根据标签名称获取元素对象集合

                                    getElementsByAttribute(String key):根据属性名称获取元素对象集合

                                    getElementsByAttributeValue(String key,String Value):根据属性名称和属性值获取元素对象集合

                         三、Element:

                                    一、获取子元素对象          

                                    getElementById(String id):根据id属性值获取惟一的element对象

                                    getElementsByTag(String tagName):根据标签名称获取元素对象集合

                                    getElementsByAttribute(String key):根据属性名称获取元素对象集合

                                    getElementsByAttributeValue(String key,String Value):根据属性名称和属性值获取元素对象集合

                                    二、获取属性值

                                    String attr(String key):根据属性名称获取属性值

                                    三、获取文本内容

                                    String text():获取文本内容

                                    String html():获取标签体的因此内容

                            五、Node:节点对象

 

快捷查询方式:

             一、selector:选择器

                        Element select(String cssQuery)

             二、XPath:  

                        使用Jsoup的XPath须要额外导入jar包                                       

相关文章
相关标签/搜索