基本概念
本地事务
事务由资源管理器(如DBMS)本地管理java
- 优势:严格的ACID
- 缺点:不具有分布事务处理能力
全局事务(DTP模型)
TX协议:应用或应用服务器与事务管理器的接口mysql
XA协议:全局事务管理器与资源管理器的接口算法
两阶段提交
- 优势
- 准备后,仍可提交或回滚
- 准备时,一致性检查必须OK
- 准备后,事务结果仍然只在事务内可见
- 准备后,事务结果已经持久化
- 缺点:
- 潜在故障点多带来的脆弱性
- 准备后,提交前的故障引起一系列隔离与恢复难题
http://book.51cto.com/art/201309/410608.htmsql
跨域的全局事务(DTP模型)
- 缺点
- 更高的协议成本
- 脆弱,故障点多
- 故障影响大,恢复困难
- 复杂,更多架构与平台约束
java企业平台中的分布式事务实现
- JTA
- JTS
- JTA事务管理器的实现标准,向上支持JTA,向下经过CORBA OTS实现跨事务域的互操做性
- EJB
- 优势
- 局限
- DTP模型自己的局限
- 缺乏充分公开的大规模、高可用、密集事务应用的成功案例
JMS与分布式事务:http://techv5.com/topic/1371/编程
其它资源
- ws-transaction标准
- jbossTransaction系统
- Paxos算法
原则
- 真正重要的是知足业务需求,而不是追求抽象、绝对的系统特性
- 帽子戏法
- 酸碱(ACID-BASE Balance)
模式
CAP定理
http://zh.wikipedia.org/wiki/CAP%E5%AE%9A%E7%90%86跨域
对于共享数据系统,只能同时拥有如下三项中的两个:服务器
- Consistency(一致性): 全部 用户看到一致的数据
- Availability(可用性): 对数据更新具有高可用性
- Tolerance to Network Partition(分区容忍性): 以实际效果而言,分区至关于对通讯的时限要求。系统若是不能在时限内达成数据一致性,就意味着发生了分区的状况,必须就当前操做在C和A之间作出选择
理解架构
- 容许至少一个节点更新状态会致使数据不一致,即丧失了C性质。
- 若是是多个节点,而后多个节点都是高可用的,此时确定有个前后顺序,这时确定无法保证一致性。
- 若是为了保证数据一致性,将分区一侧的节点设置为不可用,那么又丧失了A性质。
- 好比mysql主备节点,通常是主机统一对事务进行控制;备机只用来读。这样就尚失了A性质。
- 除非两个节点能够互相通讯,才能既保证C又保证A,这又会致使丧失P性质。
- 若是要求同时达到一致性和可用性,那就无法分区了,由于一旦分区确定会有时间窗口致使上面C或A的不知足。
酸碱平衡 (BASE)
- BA(Basic Availability)
- S(soft state)
- E(Eventuall consistency)
eBay的BASE最佳实践
ebay没有使用任何的分布式事务客户端或系统app
他们使用其它技术来保证最终一致性 - careful ordering of database operations - asynchronous recovery events - reconciliation or settlement batches框架
分布式事务方案一:按期校对
服务模式1:可查询操做
服务操做的可标识性
服务操做具备全局惟一标识
复合模式1:按期校对

需保证在事务提交后才能发送
分布式事务方案二:基于MQ
服务模式2:幂等操做
经过业务操做自己实现幂等性
服务模式2:可靠消息
实现:
- 业务活动的主动方,在完成业务处理的同一个本地事务中,记录消息数据
- 业务处理事务提交后、经过实时消息通知业务被动方,实时通知成功后删除消息数据
- 消息恢复系统按期找到未成功发送的消息,交给实时消息服务补发送
约束:
- 被动方的处理结果不影响主动方的处理
- 被动方的消息处理操做是幂等操做
成本:
适用范围
可靠消息的另外一种实现
实现
- 业务处理在业务事务提交前,向实时消息服务请求发送消息,实时消息服务只记录消息数据,而不真正发送
- 业务处理服务在业务事务提交后,向实时消息服务确认发送。只有在获得确认发送指令后,实时消息服务才真正发送消息
- 业务处理在业务事务回滚后,向实时消息服务取消发送
- 消息状态确认系统按期找到未确认发送或回溯的消息,向业务处理服务询问消息状态,业务处理服务根据消息ID或消息内容肯定该消息是否有效。
成本
- 一次消息发送须要两次请求
- 业务处理服务需实现消息状态回查接口
优势:
- 消息数据独立存储、独立伸缩
- 下降业务系统与消息系统间的耦合
分布式事务方案三:基于TCC
服务模式3:TCC操做
Try: 尝试执行业务
- 完成全部业务检查(一致性)
- 预留必须业务资源(准隔离性)
Confirm: 确认执行业务
- 真正执行业务
- 不做任何业务检查
- 只使用Try阶段预留的业务资源
- Confirm操做知足幂等性
Cancel: 取消执行业务
- 释放Try阶段预留的业务资源
- Cancel操做知足幂等生
与2PC协议比较
- 位于业务服务层而非资源层
- 没有单独的准备阶段,Try操做兼备资源操做与准备能力
- Try操做能够灵活选择业务资源的锁定粒度
- 较高开发成本
复合模式3:TCC模式
适用范围 - 强隔离性、严格一致性要求的业务活动 - 适用于执行时间较短的业务
分布式事务方案四:基于补偿(百度钱包方案)
适用范围 - 弱隔离性、弱一致性要求的业务活动 - 特别适用于执行时间较长的业务,如工做流
通常适合于金融系统,例如加钱减钱
基础设施
- 服务框架
- 消息系统
- 数据存储
- 分布式任务调度
- 服务注册中心
- 提供服务元数据集中注册、查询与管理能力,支持事务相关属性的描述
参考