Digester 是一个依据 xml 配置文件动态构建 Java 对象树的工具,基于 SAX 解析器进行封装,它为 SAX 事件的处理提供了更高级和友好的接口,让开发更专一于要执行的处理,隐藏了 XML 元素详细的层次结构信息。java
为了便于实现,内部使用堆栈存储建立的对象。当知足元素匹配模式时,按预设的处理规则操做栈中对象。编程
典型的建立对象处理逻辑是,触发建立新对象的规则,在遇到特定 XML 元素的开头时将其推送到栈顶;处理此元素的嵌套内容和属性时,该对象将保留在堆中;当遇到元素的末尾时,将它弹出。缓存
Digester 提供的处理规则解决了这种设计的几个潜在问题:微信
Digester 解析器的一个主要特性是自动肯定正在解析的 XML 文档的元素层次结构,开发人员只需在解析过程当中遇到某种嵌套元素排列时,决定要执行哪些函数。元素匹配模式,确认的就是执行函数也就是规则。数据结构
一个很是简单的元素匹配模式是一个简单的字符串,如"a"。只要在 XML文档中遇到顶级元素 <a>,不管它发生多少次,都会匹配此模式。请注意,嵌套的 <a> 元素将不匹配此模式。框架
比较复杂的是匹配嵌套元素,如 "a/b",当找到嵌套在顶级 <a> 元素内的 <b> 元素时,将匹配此模式。一样,这种匹配能够根据须要屡次发生,具体取决于要解析的XML文档的内容。也可使用多个斜杠来定义要匹配的任何所需深度的层次结构。函数
例如,假设已注册与 "a", "a/b", 和 "a/b/c" 模式匹配的处理规则。对于具备如下内容的输入XML文档,在解析相应元素时将匹配指示的模式:工具
<a> -- 匹配 "a"
<b> -- 匹配 "a/b"
<c/> -- 匹配 "a/b/c"
<c/> -- 匹配 "a/b/c"
</b>
<b> -- 匹配 "a/b"
<c/> -- 匹配 "a/b/c"
<c/> -- 匹配 "a/b/c"
<c/> -- 匹配 "a/b/c"
</b>
</a>
复制代码
经过在匹配的模式字符串中使用 "*" 通配符,也能够匹配特定的XML元素,不管它是如何嵌套(或不嵌套)在XML文档中。例如,元素匹配模式 "*/a" 将匹配文档内任何嵌套位置的元素 <a>。源码分析
若是一个匹配模式对应多个处理规则,将按顺序触发。 begin(和body)方法按照最初向 Digester 注册的 Rules 的顺序执行,而 end 方法调用以相反的顺序执行。 换句话说 - 顺序是先进先出的。spa
处理规则定义的时模式匹配时应该发生的动做,它一般时 Rule 接口的子类,每一个规则实现了如下一个或多个事件方法,这些方法会在解析的过程当中执行:
Digester 提供了一组处理规则实现类,用于处理许多常见的编程场景,这些类分别是:
假设有两个简单的 JavaBeans,Foo 和 Bar,方法签名以下:
package mypackage;
public class Foo {
public void addBar(Bar bar);
public Bar findBar(int id);
public Iterator getBars();
public String getName();
public void setName(String name);
}
public mypackage;
public class Bar {
public int getId();
public void setId(int id);
public String getTitle();
public void setTitle(String title);
}
复制代码
而且使用 Digester 来解析如下 XML 文档:
<foo name="The Parent">
<bar id="123" title="The First Child"/>
<bar id="456" title="The Second Child"/>
</foo>
复制代码
一个简单的方法是使用 Digester 设置以下方式的解析规则,而后处理包含此文档的输入文件:
Digester digester = new Digester();
digester.setValidating(false);
digester.addObjectCreate("foo", "mypackage.Foo");
digester.addSetProperties("foo");
digester.addObjectCreate("foo/bar", "mypackage.Bar");
digester.addSetProperties("foo/bar");
digester.addSetNext("foo/bar", "addBar", "mypackage.Bar");
Foo foo = (Foo) digester.parse();
复制代码
这些规则将按顺序执行如下任务:
解析完成后,第一个被推入堆栈的对象(本例中为 Foo 对象)将返回,它的属性已被初始化,并包含建立的全部子 Bar 对象。
每一个框架都有本身解析 XML 的方法,Tomcat 也不例外,本文对 Digester 的基本原理进行了总结,使用仍是比较简单方便的。
此外,Digester 还有一些其余设置,好比指定建立对象使用的类加载器,是否以命名空间的方式解析,是否根据指定的 DTD 验证文档,还有 RuleSet 可重用规则集的使用等。
搜索微信公众号「顿悟源码」,获取更多源码分析和造的轮子。