分布式事务解决方案

原文连接:https://juejin.im/post/6844903842098708493web

面试题

分布式事务了解吗?大家是如何解决分布式事务问题的?面试

面试题剖析

通常来讲,分布式事务的实现主要有如下 5 种方案:数据库

  • XA 方案
  • TCC 方案
  • 本地消息表
  • 可靠消息最终一致性方案
  • 最大努力通知方案

两阶段提交方案/XA方案

所谓的 XA 方案,即:两阶段提交,有一个事务管理器的概念,负责协调多个数据库(资源管理器)的事务,事务管理器先问问各个数据库你准备好了吗?若是每一个数据库都回复 ok,那么就正式提交事务,在各个数据库上执行操做;若是任何其中一个数据库回答不 ok,那么就回滚事务。架构

这种分布式事务方案,比较适合单块应用里,跨多个库的分布式事务,并且由于严重依赖于数据库层面来搞定复杂的事务,效率很低,绝对不适合高并发的场景。若是要玩儿,那么基于 Spring + JTA 就能够搞定,本身随便搜个 demo 看看就知道了。并发

这个方案,咱们不多用,通常来讲某个系统内部若是出现跨多个库的这么一个操做,是不合规的。我能够给你们介绍一下, 如今微服务,一个大的系统分红几十个甚至几百个服务。通常来讲,咱们的规定和规范,是要求每一个服务只能操做本身对应的一个数据库分布式

若是你要操做别的服务对应的库,不容许直连别的服务的库,违反微服务架构的规范,你随便交叉胡乱访问,几百个服务的话,全体乱套,这样的一套服务是无法管理的,无法治理的,可能会出现数据被别人改错,本身的库被别人写挂等状况。微服务

若是你要操做别人的服务的库,你必须是经过调用别的服务的接口来实现,绝对不容许交叉访问别人的数据库。高并发

 

TCC 方案

TCC 的全称是:Try、Confirm、Cancel。post

  • Try 阶段:这个阶段说的是对各个服务的资源作检测以及对资源进行锁定或者预留
  • Confirm 阶段:这个阶段说的是在各个服务中执行实际的操做
  • Cancel 阶段:若是任何一个服务的业务方法执行出错,那么这里就须要进行补偿,就是执行已经执行成功的业务逻辑的回滚操做。(把那些执行成功的回滚)

这种方案说实话几乎不多人使用,咱们用的也比较少,可是也有使用的场景。由于这个事务回滚其实是严重依赖于你本身写代码来回滚和补偿了,会形成补偿代码巨大,很是之恶心。code

好比说咱们,通常来讲跟相关的,跟钱打交道的,支付交易相关的场景,咱们会用 TCC,严格保证分布式事务要么所有成功,要么所有自动回滚,严格保证资金的正确性,保证在资金上不会出现问题。

并且最好是你的各个业务执行的时间都比较短。

可是说实话,通常尽可能别这么搞,本身手写回滚逻辑,或者是补偿逻辑,实在太恶心了,那个业务代码很难维护。

 

本地消息表

本地消息表实际上是国外的 ebay 搞出来的这么一套思想。

这个大概意思是这样的:

  1. A 系统在本身本地一个事务里操做同时,插入一条数据到消息表;
  2. 接着 A 系统将这个消息发送到 MQ 中去;
  3. B 系统接收到消息以后,在一个事务里,往本身本地消息表里插入一条数据,同时执行其余的业务操做,若是这个消息已经被处理过了,那么此时这个事务会回滚,这样保证不会重复处理消息
  4. B 系统执行成功以后,就会更新本身本地消息表的状态以及 A 系统消息表的状态;
  5. 若是 B 系统处理失败了,那么就不会更新消息表状态,那么此时 A 系统会定时扫描本身的消息表,若是有未处理的消息,会再次发送到 MQ 中去,让 B 再次处理;
  6. 这个方案保证了最终一致性,哪怕 B 事务失败了,可是 A 会不断重发消息,直到 B 那边成功为止。

这个方案说实话最大的问题就在于严重依赖于数据库的消息表来管理事务啥的,会致使若是是高并发场景咋办呢?咋扩展呢?因此通常确实不多用。

 

可靠消息最终一致性方案

这个的意思,就是干脆不要用本地的消息表了,直接基于 MQ 来实现事务。好比阿里的 RocketMQ 就支持消息事务。

大概的意思就是:

  1. A 系统先发送一个 prepared 消息到 mq,若是这个 prepared 消息发送失败那么就直接取消操做别执行了;
  2. 若是这个消息发送成功过了,那么接着执行本地事务,若是成功就告诉 mq 发送确认消息,若是失败就告诉 mq 回滚消息;
  3. 若是发送了确认消息,那么此时 B 系统会接收到确认消息,而后执行本地的事务;
  4. mq 会自动定时轮询全部 prepared 消息回调你的接口,问你,这个消息是否是本地事务处理失败了,全部没发送确认的消息,是继续重试仍是回滚?通常来讲这里你就能够查下数据库看以前本地事务是否执行,若是回滚了,那么这里也回滚吧。这个就是避免可能本地事务执行成功了,而确认消息却发送失败了。
  5. 这个方案里,要是系统 B 的事务失败了咋办?重试咯,自动不断重试直到成功,若是实在是不行,要么就是针对重要的资金类业务进行回滚,好比 B 系统本地回滚后,想办法通知系统 A 也回滚;或者是发送报警由人工来手工回滚和补偿。
  6. 这个仍是比较合适的,目前国内互联网公司大都是这么玩儿的,要不你举用 RocketMQ 支持的,要不你就本身基于相似 ActiveMQ?RabbitMQ?本身封装一套相似的逻辑出来,总之思路就是这样子的。

 

最大努力通知方案

这个方案的大体意思就是:

  1. 系统 A 本地事务执行完以后,发送个消息到 MQ;
  2. 这里会有个专门消费 MQ 的最大努力通知服务,这个服务会消费 MQ 而后写入数据库中记录下来,或者是放入个内存队列也能够,接着调用系统 B 的接口;
  3. 要是系统 B 执行成功就 ok 了;要是系统 B 执行失败了,那么最大努力通知服务就定时尝试从新调用系统 B,反复 N 次,最后仍是不行就放弃。

大家公司是如何处理分布式事务的?

若是你真的被问到,能够这么说,咱们某某特别严格的场景,用的是 TCC 来保证强一致性;而后其余的一些场景基于阿里的 RocketMQ 来实现分布式事务。

你找一个严格资金要求绝对不能错的场景,你能够说你是用的 TCC 方案;若是是通常的分布式事务场景,订单插入以后要调用库存服务更新库存,库存数据没有资金那么的敏感,能够用可靠消息最终一致性方案。

友情提示一下,RocketMQ 3.2.6 以前的版本,是能够按照上面的思路来的,可是以后接口作了一些改变,我这里再也不赘述了。

固然若是你愿意,你能够参考可靠消息最终一致性方案来本身实现一套分布式事务,好比基于 RocketMQ 来玩儿。