揭秘jbpm流程引擎内核设计思想及构架

时间 2019-11-08

标签揭秘 jbpm 流程引擎内核设计思想构架繁體版

原文原文链接

揭秘 jbpm 流程引擎内核设计思想及构架

1 前言

2 阅读本篇的基础准备

2.1 概念的基础

2.2 环境的基础

3 什么是流程引擎内核？

4 引擎内核所关注的四个主要问题

4.1 模型与定义对象

4.2 调度机制与算法

4.3 执行机制与状态

4.4 实例对象与执行环境

5 jbpm，“精简”的开源流程引擎

6 jBpm流程模型与定义对象

6.1 首先解决如何形式化描述一个流程的问题

6.2 抽象的节点（Node）和转移（Transition）

6.3 流程：节点与转移的组合

6.4 节点的类型和扩展

7 jBpm的过程调度机制

7.1 吸纳自Petri Net思想

7.2 Token的推动

7.3 很是简单的调度机制

8 jBpm的过程执行机制

8.1 执行机制

8.2 分支处理

9 jBpm内核结构与实例对象

10 后记

1 前言

流程引擎内核仅是“知足 Process 基本运行”的最微小结构，而整个引擎则要复杂不少，包括“状态存储”、“事件处理”、“组织适配”、“时间调度”、“消息服务”等等外围的服务性功能。引擎内核，仅包含最基本的对象和服务，以及用于解决流程运行问题的调度机制和执行机制。

若是，你掌握了一个流程引擎的灵魂，你才有能力理解它的所有。不然，一个引擎对你来讲，可能只是一个复杂的结构，丰富多彩API、使人眼花缭乱的“功能”和“服务”而已。

自己工做流这个领域就是一个很“狭窄”的领域，国内的厂商也不是不少，其中有部分实现技术并不弱。但可能涉于安全等因素，并无多少技术人员探讨“深度的工做流技术实现问题”。而广大的开发爱好者却还在花费大量的时间在摸索“如何理解工做流、如何应用工做流”。因此在此以前，国内还没有有一篇技术文章探讨工做流引擎内核的实现，固然也没有探讨jBpm引擎内核的文章了。在 www.javaeye.com 技术站点和个人blog（ http://blog.csdn.net/james999）上有几篇专门探讨jbpm应用的文章，对于初步想了解如何使用jbpm的读者来讲，值得看看。

对于这方面的技术分享，开源是个不错的突破口。

本篇就是以jBpm为实例，来诠释工做流引擎的内核设计思路和结构。可是这仅仅是从jBpm的实现角度来辅助你们理解，由于工做流引擎内核的设计、实现是有不少方式：这会因所选的模型、调度算法、推动机制、状态变迁机制、执行机制等多方面的不同，而会差异很大。好比基于Activity Diagram模型的jBpm和基于FSM模型的OSWorkflow引擎内核之间就有很大的差异。

相比较而言，jBpm的模型比较复杂，而引擎内核实现的比较“精简”，很是便于你们“由浅入深的理解”。

2 阅读本篇的基础准备

2.1 概念的基础

本文的读者群主要是面向有必定工做流基本概念的开发人员。因此本文认为你已经具有了以下基本工做流知识：

（1）初步了解工做流系统结构。好比理解工做流引擎在工做流系统中所处的位置和做用

（2）对流程定义（Process Definition）和流程实例（Process Instance）相关对象有所了解。好比理解Process Instance表明什么，工做项（WorkItem）表明什么。

2.2 环境的基础

在阅读本篇的时候，若是你已经搭建了一套jbpm的开发环境，那么将有助于你更容易理解本篇的不少内容，也便于实际体验代码。从 www.jbpm.org官方网站下载jbpm-starters-kit开发包，按照其参考手册，能够很容易在eclipse开发环境中创建项目，效果图相似以下：

3 什么是流程引擎内核？

我比较推崇“微内核的流程引擎构架”，并在最近两三年内写了两篇探讨此方面的文章：第一篇是写于05年7月份的《微内核流程引擎架构体系》，第二篇是07年7月份的《微内核过程引擎的设计思路和构架》（受普元《银弹》杂志约稿所写，还没有对外公开）。

但至今对外阐述引擎内核究竟是什么。

正如上面的两张图所示，咱们能够经过“微内核”的构架来使得流程引擎的结构更加“清晰”。而可否实现“微内核”的根本，则是看你是否可以设计并抽象出“良好的引擎内核结构”。

很显然，要想设计出一套结构优良的引擎内核，首要条件就是：明白什么是引擎内核。

首先咱们须要明白引擎是什么，引擎能够作什么。这在WfMC的《工做流参考模型》中已经有很详细的解答，本文再也不重复。知道这个仅仅是不够的，你还须要很清晰的明白如何去“为流程建模”，而这则在Aalst大师所著的《工做流管理——模型、方法、系统》一书有细致阐述，本文也再也不重复。

但很惋惜，至今还没有有一本专门的书籍来论述“过程建模方法”的，或者说如何利用这些既有的“过程建模方法（诸如FSM、PetriNet、EPC、Activity Diagram等等）”来解决流程问题。这个只能分别查阅相关资料，此处也不叙述。

由于文本只讲“引擎内核”。

若是咱们暂且把那复杂的流程业务性问题，诸如“组织模型分配”、“分支条件计算”、“事件处理”、“消息调度”、“工做项处理”、“存储”、“应用处理”、以及那些“变态的诸如会签、回退之类的模型”都通通的抛弃，只留下“最单纯的过程性问题”，也就是“解决一个过程运行问题，按秩序的从一个节点到另外一个节点的执行”。—— 这就是引擎内核所关注的根本问题。

上面这句话，估计会引发不少人“拍砖”。在不少人看来，工做流之因此看起来很“难”，就是由于这些复杂多变的“业务性问题”都通通绑在一个“引擎”上形成的。

其实，这是两个“维度”的问题，也就是“引擎的抽象”和“引擎的应用”这两个不一样维度，不一样层面的问题。但这毫不是两个独立的问题，“引擎的抽象”的好与坏，直接影响到“引擎的应用”的可复杂度和可支持度，固然咱们也不可否认，“引擎的应用”问题也是一个很复杂的问题。但本文是站在“引擎的抽象”这个维度来阐述问题的。对于“引擎的应用”问题，可参考个人前做：2003年11月份的《工做流模型分析》、 2003年12月份的《工做流受权控制模型》、2004年7月份的《工做流系统中组织模型应用解决方案》。

也就是说，本文不是指导你们如何去“使用jbpm”，而是阐述“jbpm的引擎的内核部分是如何构建的”。但本文的主旨不是告诉你们“jBpm是如何设计引擎内核的”，而是以jBpm为例，来介绍“引擎内核”。

4 引擎内核所关注的四个主要问题

引擎内核所关注的是一个很是“抽象”层面的问题，而不一样引擎关注的“一套完整的执行环境”。或者咱们能够这么来讲，引擎内核的职责是很是“精简”的：确保流程按照既有的定义，从一个节点运行到另外一个节点，并正确执行当前节点。

总的来讲，引擎内核主要关注四个方面的问题：

（1）流程定义问题：不是说如何图形化的定义流程，而是如何用一套定义对象，来诠释所定义的流程。

（2）流程调度问题：提供什么的机制，能够确保流程可以处理复杂的“流程图结构”，诸如串行、并行、分支、聚合等等，并在这复杂结构中确保流程从一个节点运行到另外一个节点。

（3）流程执行问题：当流程运行到某个节点的时候，须要一套机制来解决：是否执行此节点，并如何执行此节点的问题，并维持节点状态生命周期。

（4）流程实例对象：须要一整套流程实例对象来描述流程实例运行的状态和结果。

4.1 模型与定义对象

工做流引擎自己就是一种“base on model”的组件，流程实例的执行都是依赖于所定义的“流程定义”，而工做流引擎则是提供了这样一种环境，来维持流程实例的运行。

因此引擎内核，必须提供一套定义对象来描述“流程定义”，而且这些定义对象必须反映出一种“模型”。

好比jBpm的定义对象，是与其所基于的Activity Diagram模型相对应的。

4.2 调度机制与算法

引擎内核的另外一个重要功能，就是保证流程实例准确的从一个节点运行到另外一个节点，而这则须要依赖于一套调度机制。

引擎的调度机制有不少种实现方法，有的甚至是与“所依赖的模型有关”。但广泛来说，不少引擎都受到Petri Net的影响，而采用token来调度。

jBpm自己就吸纳的token这套机制，固然，与Petri Net的调度机制仍是有所区别。咱们将在下面的章节详细介绍。

4.3 执行机制与状态

通过引擎的调度，实例运行到某个节点了，此时必须必须提供一套机制，来判断当前节点是否可执行，若是可执行，那么须要提供一套runtime envrioment来执行节点——这就是引擎的执行机制。

复杂的流程引擎会依赖于“流程实例状态”或“活动实例状态”的约束和变迁来进行处理。之全部有时候咱们会把一个流程引擎也叫作“状态机”，很大程度上也是这个缘由。

4.4 实例对象与执行环境

每一个一个流程实例，必须维护一套属于本身的“运行环境和数据”，而这则是实例对象的责任了。基本上实例对象会包含以下信息：

（1）与流程实例的状态或控制信息

（2）与活动实例的状态或控制信息。若是某些引擎不支持活动实例，那么必然会有某些其余实例信息，能够当前节点的状或控制信息。

（3）一些临时的“执行”信息，便于引擎针对某种状况进行处理

5 jbpm，“精简”的开源流程引擎

好的开源工做流引擎很少，jbpm和osworkflow算是其中两个有特点并且比较容易实际应用的。目前一些国内的中小型流程应用项目，就是在jbpm或osworkflow的基础上扩展实现。jBpm采用了Activity Diagram的模型，而osworkflow则是FSM的模型。

固然，这仅仅是jbpm3以后的事情。自从被Jboss收购以后，jbpm对早先的2.0构架进行了重组，整个结构彻底本着“微内核”的思想进行设计。

如今这里从技术角度来分析jbpm3的优势，简单罗列几个你们都容易看见的：

（1） jbpm的模型是采用UML Activity Diagram的语义，因此便于开发人员理解流程。

（2） jbpm提供了可扩展的Event-Action机制，来辅助活动的扩展处理。

（3） jbpm提供了灵活的条件表达式机制，来辅助条件解析、脚本计算的处理。

（4） jbpm提供了可扩展的Task及分配机制，来知足复杂人工活动的处理。

（5）借助hibernate的ORM的优点，jbpm可以很容易支持多种数据库。

固然，还有一些优势，是不少开发人员并不太注意的，好比：

（1） jbpm的Node机制很是灵活，开发人员能够很容易定制“业务化语义的节点”，并知足运行时候处理的须要。

有不少灵活的优势，固然也少不了存在一些“局限”。

（1）很显然，只能有一个start-state。

（2） jbpm依靠Token来调度和计算，在同一个时刻中，一个ProcessInstance只容许一个Token对象只存在一个Node中（分支固然用Child Token对象处理）。因此本质上就不支持“multi-instance”模式。

（3） jbpm做为一款开源的工做流引擎，其更多的是关注“如何辅助你更容易的让流程运行完成”，可是并不记录“流程运行的历史和轨迹”。这一点多是东西方文化的差别性所在，由于国内的流程应用，比较关注“运行轨迹”。

至于其余的一些局限，好比不支持“回退”、 “跳转”等操做，这也是由于东西方文化的差别所在。西方人认为“往回流转的状况确定也是一种业务规则所定义，那么确定能够经过分支或条件来解决”，而东方则把“回退做为一我的性化管理和处理的潜在特色”。因此诸如此类的一些“特定需求”，估计只能经过扩展jbpm来实现了，甚至有时候，简单的扩展是没法解决问题的——正如上一节所说的那样，“引擎的抽象”会影响“引擎的应用”的复杂度支持。

可是，当你试图修改jbpm代码的时候，你会顾虑jbpm的LGPL协议吗？（不少国内企业历来不考虑这个协议问题，寒）。

6 jBpm流程模型与定义对象

6.1 首先解决如何形式化描述一个流程的问题

这里说的“定义流程”并非说jbpm3中那个基于eclipse plugin的图形化建模工具。而是如何去解决“形式化的描述一个流程”的问题。

形式化的描述流程并非一个简单的问题，从上世纪七十开始，人们就在探索用各类各样多的模型来描绘流程：Petri Net, FSM, EPC, Activity Diagram, 以及近来的XPDL MetaModel等等，延伸到现在的BPEL,BPMN,BPMD等等。

jBpm采用了Activity Diagram的模型语义：其将用Start State、State、Action State（Task Node）、End State、Fork、Join、Decision、Merge、Process State这几个“元素”的组合来描述任何一个流程。其中Action State是Activity Diagram中的标准语义，在jBpm为了便于你们理解和使用，jBpm采用了TaskNode这个语义。

在WfMC的Workflow Reference Model中，对流程引擎的功能描述，其中就包含一项：解析流程定义。若是想知足这这功能，前提条件就必须有最基本的两个：

（1）有一套形式化的描述语言（一般为xml格式）。利用这个描述语言能够描述一个流程的定义。好比WfMC所提出的XPDL这个描述语言。固然，jBpm也有本身的一套，名为jPDL，也是一个xml格式的。

（2）有一套对象集能够反映流程的定义模型和结果，通常叫作定义对象。流程引擎就须要把“xml格式的流程定义”解析为一套对象，而这套对象的结构则反映了流程的结构。

咱们暂且不去探讨jPDL那个形式化的xml语言，而把重心放在jBpm那套定义对象中。由于这个定义对象是属于Engine Kernel的一部分。

6.2 抽象的节点（Node ）和转移（Transition）

面向对象的继承性、多态性可让咱们从最抽象的部分来描述对象。那么这套定义对象也须要从最基础的“抽象”提及。

process 的本质就是“节点”和“有向弧” ，固然你也能够说是Node和Link，或者Node和Transition，或者Activity和Transition等等之类的。jBpm采用的是Node和Transition来表示“节点”和“有向弧”。

因而乎，在jbpm中你能够看到这样的结构关系：

对于一个节点来讲，从定义角度，其只关心几个事情：

（1）这是个什么类型的节点。这个节点多是start state，也多是一个task node，或者是一个fork。

（2）这个节点的转入Transition和转出Transition。

可能有的人会说，还须要关心节点的转入转出的类型，好比And Splite或者Xor Join之类。这个并无错，由于不少流程模型的节点元素须要考虑这个，好比WfMC的XPDL模型。可是jBpm的节点是没有这样的属性的，或者说的更准确些，是Activity Diagram模型的节点没有这样的特性。活动图是采用“Fork”、“Join”这样的节点来解决“分支”问题。

6.3 流程：节点与转移的组合

仅利用节点和转移的组合，就能够表达一个“过程（Process）”。固然这个流程只能告诉人们“大概的业务过程”，固然不包括很复杂的信息。以下图所示：

这是一张很是标准的“活动图”，若是咱们用jbpm的设计器，看看这样一张“流程图”：

不论你如何绘画，改变不了这张图的本质：它就只有两个基本元素：节点和转移。只是有的节点是start-state，有的是task-node，有的是join，有的是end state而已。

6.4 节点的类型和扩展

咱们能够经过定义本身的Node节点对象，来补充jbpm自定的节点对象。只须要extends Node，并重写读写xml的read和write方法，重写负责执行的execute方法，在org/jbpm/graph/node /node.types.xml中配置便可，固然，你能够写的更加复杂，更加业务化的节点。

7 jBpm的过程调度机制

7.1 吸纳自Petri Net 思想

jBpm的过程调度机制是吸纳了Petri Net的一些思想。

jBpm采用Token来表示当前实例运行的位置，也利用token在流程各个点之间的转移来表示流程的推动，以下图所示：

当jbpm试图去启动一个流程的时候，首先是构造一个流程实例，并为此流程实例建立一个Root Token，并把这个Root Token放置在Start Node上。

如下截取部分代码实现，仅供参考。手头有jbpm3相应开发环境的朋友，能够打开ProcessInstance和Token这两个类。（注：如下全部参考代码，为了突出主题，都已经将实际代码中的event,log等处理删除）

public ProcessInstance( ProcessDefinition processDefinition ) {

this.processDefinition = processDefinition;

this.rootToken = new Token(this);

public Token(ProcessInstance processInstance) {

this.processInstance = processInstance;

this.node = processInstance.getProcessDefinition().getStartState();

jbpm是容许在start-state执行Task的，也容许在start-state建立工人任务。不过此处咱们不予讨论。

7.2 Token 的推动

当Token已经在Start-State节点了，咱们能够开始往前推动，来促使流程实例往前运行。对于外部操做来讲，触发流程实例往下运行的操做有两个：

（1）强制执行ProcessInstance的signal操做

（2）执行TaskInstance的end操做。

可是，这两个操做，都是经过“当前token的signal操做”来内部实现的，以下图所示：

Token 的 Signal 操做表示：实例须要离开当前 token 所在的节点，转移到下一个节点上。由于 Node 与 Node 之间是“ Transition ”这个桥梁，因此，在转移过程当中，会首先把 Token 放入相关连的 Transtion 对象中，再由 Transition 对象把 Token 交给下一个节点。

让咱们来看看Token类中signal方法的部分代码实现，仅供参考：

public void signal() {

// 注意 ExecutionContext 对象

signal(node.getDefaultLeavingTransition(), new ExecutionContext(this));

}

void signal(Transition transition, ExecutionContext executionContext) {

// start calculating the next state

node.leave(executionContext, transition);

}

接下来，请注意node.leave()这个操做。这是一个颇有意思的语义转换：咱们是采用token的signal操做来表示往下一个节点推动，可是实际确实执行的node.leave ()操做。

若是这地方让你本身来实现，代码会不会就是这样子呢？不妨此处想想。

// 假设代码，仅供思考
void signal(Transition transition, ExecutionContext executionContext) {

transition.take(executionContext);

}

前面说过，jbpm的调度机制吸纳的Petri Net的思想。在Petri Net中，并无transition中驻留token这个语义，token只驻留在库所（Place）中。因此，jbpm此处的设计思路，是于此有必定关系的。因此只是把一个ExecutionContext对象放在了transition中，而不是一个token对象。

让咱们来看看node对象的leave方法：

public void leave(ExecutionContext executionContext, Transition transition) {

Token token = executionContext.getToken();

token.setNode(this);

executionContext.setTransition(transition);

executionContext.setTransitionSource(this);

transition.take(executionContext);

}

咱们直接跟踪进Transition的take操做：

public void take(ExecutionContext executionContext) {

executionContext.getToken().setNode(null);

// pass the token to the destinationNode node

to.enter(executionContext);

}

通过这么多的中间步骤，咱们终于把ExecutionContext对象从一个node转移到下一个node了。让咱们来看看Node对象的enter操做：

public void enter(ExecutionContext executionContext) {

Token token = executionContext.getToken();

token.setNode(this);

// remove the transition references from the runtime context

executionContext.setTransition(null);

executionContext.setTransitionSource(null);

// execute the node

if (isAsync) {

} else {

execute(executionContext);

}

至此，jBpm成功的从一个节点转移到下一个节点了。—— 这就是jbpm的调度机制。

7.3 很是简单的调度机制

怎么样，是否是很是的简单？
让咱们把整个过程，用一张更清晰的“思惟图”来展现一下：

8 jBpm的过程执行机制

8.1 执行机制

前面咱们的“过程调度机制”是为了让流程能够正确的从“一个节点转移到下一个节点”，而本节所要讲解的jbpm“执行机制”，则是为提供一个运行机制，来保证“节点的正确执行”。

首先咱们须要明确以下的概念：

（1）节点有不少中，每种节点的执行方式确定是不同的

（2）节点有本身的生命周期，不一样的生命周期阶段，所处的状态不一样。

在WfMC的《工做流参考模型》文档中，为活动实例概括了几个可参考的生命周期。（仅供参考，实际不少工做流引擎的节点的生命周期要比这复杂）

可是，jbpm并无突出“节点生命周期”这个理念，仅仅只是在“Event”中体现出出来。在我看来，可能的缘由有两个：

（1） jBpm 没有 NodeInstance 这个概念。利用Token和TaskInstance，jBpm足以持久化足够的信息，可以让流程实例迅速定位到当前运行的状态。

（2） jBpm的Event已经很丰富，而且这个Event是围绕“Token的转移”而设置的，并非围绕Node的生命周期设置的。

（3）一般咱们须要在Active和Completed的生命周期内所要操做的分支与聚合，在jBpm模型中分别由Fork、Join之类的节点替代。因此jBpm过度关注Node生命周期的管理意义不是很是大。

做为我的，我并不行赏jBpm这样抛弃“节点生命周期管理”的实现方式，更行赏OBE（最先的基于 XPDL模型的java工做流引擎之一）的生命周期约束和管理。可是，也不得不认可，jBpm规避了“繁琐的状态维护”，反而让处理变得“简易”，也更容易被你们所理解和接受，而这也正是OBE逐渐消失的一个缘由：过于复杂和臃肿。

让咱们在前面那张jBpm的“调度机制思惟图”上，再稍稍补充一点（为了突出显示，与上图有所改动）。

这张图应该能够很好的诠释出，jBpm是如何执行各类节点的，这也是得益于OO的“多态与继承”特性。

8.2 分支处理

jBpm的执行机制很是简单，但仍是须要稍微补充一下有关“分支”方面的处理。

jBpm采用sub token的机制来解决分支方面的处理：当遇到有分支的时候，会为每一个分支节点建立一个child token。在聚合节点（Join或Merge），则依赖其同步或异步的聚合方式，来分别处理。

好比咱们参看Fork节点的执行代码（为了突出重点，省略部分代码）：

public void execute(ExecutionContext executionContext) {

Token token = executionContext.getToken();

Iterator iter = transitionNames.iterator();

while (iter.hasNext()) {

String transitionName = (String) iter.next();

forkedTokens.add(createForkedToken(token, transitionName));

}

iter = forkedTokens.iterator();

while( iter.hasNext() ) {

// 省略部分代码

ExecutionContext childExecutionContext = new ExecutionContext(childToken);

leave(childExecutionContext, leavingTransitionName);

}

protected ForkedToken createForkedToken(Token parent, String transitionName) {

Token childToken = new Token(parent, getTokenName(parent, transitionName));

forkedToken = new ForkedToken(childToken, transitionName);

return forkedToken;

}

至于Merge节点，我想此处不用在累赘的展现，有兴趣的，能够参看Merge类的execute方法，便可。

9 jBpm内核结构与实例对象

Jbpm引擎内核的结构很是“精简”。除了咱们上面所说的那些定义对象（各类Node节点和Transtion），还有几个与“运行实例”相关的对象。以下图所示，jbpm引擎内核对象主要是在org.jbpm.graph.def和org.jbpm.graph.exe包。

（1）咱们须要描述一个流程实例，因此须要一个ProcessInstance对象。

（2）每一个流程实例，都会维护一套属于其本身的“执行环境”，也就是ExecutionContext对象。注意，这里是一套，而不是一个。

10 后记

上半年写了些bpm和SOA的文章，也被csdn的好友拉着忽悠了很多这方面的概念，弄的好像我开始搞这方面的工做似的。其实否则，本质工做与这有“天壤之别”，彻底是很是底层的java技术应用。而workflow，也有两三年没有从事这方面的开发了，因此写此篇文章，着实费了点功夫。

想痛痛快快写篇有关“引擎内核”的文章，这个想法由来以及了，却担忧本身不足以诠释清楚，反而容易误导他人，遂中途屡次放弃。

正如前面所说的那样，引擎内核的实现，并无一套“固定的模式”或者“固定的实现体系”，会由于不少因素而形成实现不一样。若是想把“引擎内核”的实现真正诠释清楚，必须把这些相关因素都诠释明朗——但这依然是一个浩大的工程。

前些日子，受朋友所托，为他们的公司学员讲了几节工做流的课程，期间尝试jBpm来诠释了一下引擎的实现思路，发现效果不错。——受此引起，遂萌发了以jBpm为实例，来简单诠释“流程引擎内核”想法。

耗时一周的业余时间，虽然还很难诠释本身的所有想法，但“点出几个要点”，仍是应该有了。