XMLcss
概念:可扩展标记语言,标签都是自定义html
功能:存储数据网络
一、配置文件dom
二、在网络中传输工具
XML和HTML的区别:一、xml标签都是自定义的,html标签都是预约义的编码
二、xml的语法严格,html语法松散url
三、xml是存储数据的,html是展现数据的操作系统
语法:一、xml文档的后缀名 .xmlxml
二、xml第一行必须定义为文档声明 <? xml version = '1.0' ?>htm
三、xml文档中有且仅有一个根标签
四、属性值必须使用引号(单双均可)引发来
五、标签必须正确关闭
六、xml标签名称区分大小写
组成部分:一、文档声明
格式:<? xml 属性列表 ?>
属性列表:version:版本号,必须属性
encoding:编码方式,告知解析引擎当前文档使用的字符集,默认值:ISO-8859-1
standalone:是否独立,取值yes , no
二、指令
结合css
三、标签
标签名称自定义规则:一、名称能够包含字母、数字以及其余的字符
二、名称不能以数字或者标点符号开始
三、名称不能以字母xml(Xml,Xml等等)开始
四、名称不能包含空格
四、属性
id属性值惟一
五、文本
CDATA区:在该区域中的数据会被原样展现
格式:<![CDATA][ 数据 ]>
XML的约束:规定xml文档的书写规则
分类:DTD:一种简单的约束技术
Schema:一种复杂的约束技术
DTD:引入dtd文档到xml文档中
内部dtd:将约束规则定义在xml文档中
<! DOCTYPE 根标签名 [约束内容]>
外部dtd:将约束的规则定义在外部的dtd文件中
本地:<! DOCTYPE 根标签名 SYSTEM “dtd文件的位置”>
网络:<! DOCTYPE 根标签名 PUBLIC “dtd文件名字”“dtd文件的位置URL”>
Schema:
引入:一、填写xml文档的根目录
二、引入xsi前缀
三、引入xsd文件的命名空间
四、为每一个xsd约束声明一个前缀
XML的解析:
读取:将文档中的数据读取到内存中
写入:将内存中的数据保存到xml文档中,持久化存储
方式:
一、DOM:将标记语言文档一次性加载进内存,在内存中造成一棵DOM树
优势:操做方便,能够对文档进行CRUD的全部操做
缺点:占内存
二、SAX:逐行读取,基于事件驱动
优势:不占内存
缺点:只能读取,不能增删改
xml常见的解析器:
一、JAXP:sun公司提供的解析器,支持dom和sax思想
二、DOM4J:一款很是优秀的解析器
三、Jsoup:Java的HTML解析器
四、PULL:安卓操做系统内置的解析器,sax方式
Jsoup:
使用步骤:一、导入jar包
二、获取document对象
三、获取对应标签的Element 对象
四、获取数据
对象的使用:一、Jsoup:工具类,能够解析html或xml文档,返回Document
方法:parse:解析html或xml文档,返回Document
parse(File in,string charsetName):解析xml或html文件的
parse(String html):解析xml或html字符串
parse(URL url,int timeoutMillis):经过网络路径获取指定的html或xml的文档对象
二、Document:
一、获取Element:
getElementById(String id):根据id属性值获取惟一的element对象
getElementsByTag(String tagName):根据标签名称获取元素对象集合
getElementsByAttribute(String key):根据属性名称获取元素对象集合
getElementsByAttributeValue(String key,String Value):根据属性名称和属性值获取元素对象集合
三、Element:
一、获取子元素对象
getElementById(String id):根据id属性值获取惟一的element对象
getElementsByTag(String tagName):根据标签名称获取元素对象集合
getElementsByAttribute(String key):根据属性名称获取元素对象集合
getElementsByAttributeValue(String key,String Value):根据属性名称和属性值获取元素对象集合
二、获取属性值
String attr(String key):根据属性名称获取属性值
三、获取文本内容
String text():获取文本内容
String html():获取标签体的因此内容
五、Node:节点对象
快捷查询方式:
一、selector:选择器
Element select(String cssQuery)
二、XPath:
使用Jsoup的XPath须要额外导入jar包