用前一篇文章所建立的xml文档来作试验了,完整内容以下:java
<!-- lang: xml --> <?xml version="1.0" encoding="GBK"?> <breakfast_menu> <!--这是根节点--> <food> <name>hamburger</name> <name>汉堡包</name> <price currency="dollar">$1.95</price> <description>A sandwich made with a patty bun......</description> <calories unit="kCal">260</calories> </food> <food> <name>Strawberry Belgian Waffles</name> <name>华夫饼 </name> <price currency="dollar">$7.95</price> <description>light Belgian waffles covered...</description> <calories unit="kCal">900</calories> </food> <food> <name>Berry-Berry Belgian Waffles</name> <name>不知道什么鸟东西 </name> <price currency="dollar">$8.95</price> <description>为了美观描述就写少点了 ......</description> <calories unit="kCal">900</calories> </food> </breakfast_menu>
首先要导入dom4j组件中的两个包,一个是dom4j-1.6.1.jar文件,另外一个lib文件夹下的jaxen-1.1-beta-6.jar包。 java代码,写的乱,发现写注释会更乱dom
<!-- lang: java --> import java.io.File; import java.util.Iterator; import java.util.List; import org.dom4j.Attribute; import org.dom4j.Document; import org.dom4j.Element; import org.dom4j.io.SAXReader; public class Dom4jTest { public static void main(String[] args) throws Exception { // 从文件读取XML,输入文件名,返回XML文档 File file = new File("E:"+File.separator+"001.xml"); SAXReader reader = new SAXReader(); Document doc = reader.read(file); Element root = doc.getRootElement(); //获取根节点 for (Iterator i = root.elementIterator(); i.hasNext(); ) { Element el = (Element) i.next(); List<Element> list = el.elements("name"); System.out.println(list.get(0).getName()+":"+list.get(0).getText()); System.out.println(list.get(1).getName()+":"+list.get(1).getText()); Element price = el.element("price"); System.out.println("标签名为:"+price.getName()); System.out.println("该节点值为:"+price.getText()); Element description = el.element("description"); System.out.println("该父元素为:"+description.getParent().getName()); System.out.println(description.getNodeType()); Element calories = el.element("calories"); Attribute ca = (Attribute) calories.attributes().get(0); //取得节点属性 System.out.println(ca.getName()+":"+ca.getValue()); System.out.println("属性unit的值为:"+calories.attributeValue("unit")); System.out.println("========================="); } } }
dom4j解析xml文档的大体步骤code
第一步. 使用 org.dom4j.io.SAXReader 类的read(String fileName)方法读取并解析xml文档,返回org.dom4j.Document 接口的一个对象;xml
<!-- lang: java --> // 实例化SAXReader对象,调用read()方法读取XML文档,返回XML文档 SAXReader reader = new SAXReader(); Document doc = reader.read(new File(fileName));
第二步.取得根节点,返回org.dom4j.Element 接口的一个对象;对象
<!-- lang: java --> //获取ROOT(根)节点 Element root = doc.getRootElement();
第三步 . 遍历XML树(枚举(Iterator)、递归 、Visitor模式),上面的代码用了下面的方式实现。递归
<!-- lang: java --> // 枚举全部子节点 for ( Iterator i = root.elementIterator(); i.hasNext(); ) { Element el = (Element) i.next(); // do something }
============ 结合上面的实例整理一些dom4j解析xml的经常使用API ===============接口
获取子节点的两种方法:element(String name)和elements(String name)ip
1 . 文档中 price 、description 、calories 这三个标签在根节点中的名称都是惟一的,所以能够用element();element
<!-- lang: java --> //获取<price> 、<description> 、<calories>节点 Element price = el.element("price"); Element calories = el.element("calories"); Element description = el.element("description");
2 . 而 name 标签在根节点下并非惟一的,须要用elements(),而且用List接受文档
<!-- lang: java --> //获取全部<name>节点 List<Element> list = el.elements("name");
org.dom4j.Element接口下几个经常使用方法;
1 . getName()方法,用于返回节点名称。
<!-- lang: java --> //取得<price>的节点名 Element price = el.element("price"); System.out.println("标签名为:"+price.getName()); //结果为:price
2 . getText() 方法 ,用于返回节点值。
<!-- lang: java --> //取得<price>的节点值 Element price = element.element("price"); System.out.println("该节点值为:"+price.getText()); //第一次结果为:$1.95
3 . attributes方法, 返回该元素的属性列表
<!-- lang: java --> //取得<calories unit="kCal">中的属性列表,如有多个用get(i)依次获取 Element calories = element.element("calories"); Attribute ca = (Attribute) calories.attributes().get(0); //取得第一个节点属性
4 . attributeValue(String name) ,根据传入的属性名获取属性值
<!-- lang: java --> //取得<calories unit="kCal">中的unti属性的值 Element calories = element.element("calories"); System.out.println("属性unit的值为:"+calories.attributeValue("unit"));//结果为:kCal
5 . getParent() , 返回一个父元素
<!-- lang: java --> Element description = el.element("description"); System.out.println("该父元素为:"+description.getParent().getName()); //结果为food
org.dom4j.Attribute 接口下的两个方法;
1 . getName() 获取属性名 getValue() 获取属性值
<!-- lang: java --> //获取<calories unit="kCal">中的属性名和属性对应的值 Element calories = el.element("calories "); Attribute ca =(Attribute)calories.attributes().get(0); System.out.println(ca.getName()+":"+ca.getValue()); 第一次结果为:unit:kCal ===================之后再补充======================