分布式事务思考

时间 2019-11-08

标签分布式事务思考栏目系统架构繁體版

原文原文链接

今天分享的是一篇来自掘金的专栏文章《从一笔金币充值去思考分布式事务》mysql

https://juejin.im/post/5baa54e1f265da0ac2566fb2redis

文章纲要

这次分享的原因sql
目前分布式事务问题是怎么解决的数据库
行业中有什么解决方案编程
这些解决方案分别有什么优缺点缓存
别人是怎么作的服务器
咱们能够怎么来作微信

这次分享的原因

支付重构

考虑支付重构的时候，天然想到本来属于一个本地事务中的处理，如今要跨应用了要怎么处理。拿充值订单举个栗子吧，假设：本来订单模块和帐户模块是放在一块儿的，如今须要作服务拆分，拆分红订单服务，帐户服务。本来收到充值回调后，能够将修改订单状态和增长金币放在一个mysql事务中完成的，可是呢，由于服务拆分了，就面临着须要协调2个服务才能完成这个事务网络

因此就带出来，咱们今天要分享和讨论的话题是：怎么解决分布式场景下数据一致性问题，暂且用分布式事务来定义吧。数据结构

一样的问题还存在于其余的场景：

送礼：

1. 调用支付服务：先扣送礼用户的金币，而后给主播加相应的荔枝
2. 确认第一步成功后，播放特效，发聊天室送礼评论等

在涉及支付交易等付费接口的时候，数据一致性的问题就显得尤其重要，由于都是钱啊

目前分布式事务是怎么解决的呢？

问题确定不是新问题，也就是目前已经有相应的解决方案了，那就看一下如今是怎么来解决这类问题的吧。

以购买基础商品成功后发送支付订单完成消息为例：

假设支付下单购买基础商品，此刻已经收到支付回调，订单已经处理成功了，这个时候kafka服务故障，消息发送失败；而这个时候处理订单的事务已经提交了，怎么保证订单完成的消息必定能发出去呢？

解读一下这个流程：

绿色部分，表示流程正常运行的交互过程：

先往JobController中提交一个job（用于故障恢复）
提交成功后，开始处理订单逻辑
处理完订单逻辑以后，开始发送kafka消息
消息也发送成功后，删除第一步提交的job

黄色部分，表示流程出现了异常，数据可能存在不一致现象。这个时候就须要进行流程恢复

JobController任务控制器定时去redis查询延时任务列表（每一个任务都有一个时间戳，按时间戳排序过滤）
将任务进行恢复（调用job注册时定义的处理方法）
任务执行成功，表示流程完成；不然下一个定时周期重试

问题：

基于redis存储恢复任务，可能存在数据丢失风险
架构体系中没有统一的分布式事务规范，能否将这层逻辑独立为分布式事务中间件
缺乏事务执行策略管理，如：控制最大重试次数等
事务执行状态没有记录，追查须要去翻看日志

行业中有什么解决方案

说解决方案以前，咱们先了解一下这些方案的理论依据，有助于帮助咱们来理解和实践这些方案

理论依据（讨论的前提）

本地事务、分布式事务

若是说本地事务是解决单个数据源上的数据操做的一致性问题的话，那么分布式事务则是为了解决跨越多个数据源上数据操做的一致性问题。

强一致性、弱一致性、最终一致性

从客户端角度，多进程并发访问时，更新过的数据在不一样进程如何获取的不一样策略，决定了不一样的一致性。对于关系型数据库，要求更新过的数据能被后续的访问都能看到，这是强一致性。若是能容忍后续的部分或者所有访问不到，则是弱一致性。若是通过一段时间后要求能访问到更新后的数据，则是最终一致性

从服务端角度，如何尽快将更新后的数据分布到整个系统，下降达到最终一致性的时间窗口，是提升系统的可用度和用户体验很是重要的方面。对于分布式数据系统：

N — 数据复制的份数
W — 更新数据时须要保证写完成的节点数
R — 读取数据的时候须要读取的节点数

若是W+R>N，写的节点和读的节点重叠，则是强一致性。例如对于典型的一主一备同步复制的关系型数据库，N=2,W=2,R=1，则无论读的是主库仍是备库的数据，都是一致的。

若是W+R<=N，则是弱一致性。例如对于一主一备异步复制的关系型数据库，N=2,W=1,R=1，则若是读的是备库，就可能没法读取主库已经更新过的数据，因此是弱一致性。

CAP理论

分布式环境下（数据分布）要任什么时候刻保证数据一致性是不可能的，只能采起妥协的方案来保证数据最终一致性。这个也就是著名的CAP定理。

须要明确的一点是，对于一个分布式系统而言，分区容错性是一个最基本的要求。由于既然是一个分布式系统，那么分布式系统中的组件必然须要被部署到不一样的节点，不然也就无所谓分布式系统了，所以必然出现子网络。而对于分布式系统而言，网络问题又是一个一定会出现的异常状况，所以分区容错性也就成为了一个分布式系统必然须要面对和解决的问题。所以系统架构师每每须要把精力花在如何根据业务特色在C（一致性）和A（可用性）之间寻求平衡。

BASE 理论

BASE是Basically Available（基本可用）、Soft state（软状态）和Eventually consistent（最终一致性）三个短语的缩写。BASE理论是对CAP中一致性和可用性权衡的结果，其来源于对大规模互联网系统分布式实践的总结，是基于CAP定理逐步演化而来的。BASE理论的核心思想是：即便没法作到强一致性，但每一个应用均可以根据自身业务特色，采用适当的方式来使系统达到最终一致性。

BASE理论面向的是大型高可用可扩展的分布式系统，和传统的事物ACID特性是相反的，它彻底不一样于ACID的强一致性模型，而是经过牺牲强一致性来得到可用性，并容许数据在一段时间内是不一致的，但最终达到一致状态。但同时，在实际的分布式场景中，不一样业务单元和组件对数据一致性的要求是不一样的，所以在具体的分布式系统架构设计过程当中，ACID特性和BASE理论每每又会结合在一块儿。

柔性事务

不一样于ACID的刚性事务，在分布式场景下基于BASE理论，就出现了柔性事务的概念。要想经过柔性事务来达到最终的一致性，就须要依赖于一些特性，这些特性在具体的方案中不必定都要知足，由于不一样的方案要求不同；可是都不知足的话，是不可能作柔性事务的。

可见性(对外可查询)

在分布式事务执行过程当中，若是某一个步骤执行出错，就须要明确的知道其余几个操做的处理状况，这就须要其余的服务都可以提供查询接口，保证能够经过查询来判断操做的处理状况。

为了保证操做的可查询，须要对于每个服务的每一次调用都有一个全局惟一的标识，能够是业务单据号（如订单号）、也能够是系统分配的操做流水号（如支付记录流水号）。除此以外，操做的时间信息也要有完整的记录。

幂等操做

幂等性，实际上是一个数学概念。幂等函数，或幂等方法，是指可使用相同参数重复执行，并能得到相同结果的函数。

在编程中一个幂等操做的特色是其任意屡次执行所产生的影响均与一次执行的影响相同。也就是说，同一个方法，使用一样的参数，调用屡次产生的业务结果与调用一次产生的业务结果相同。这一个要求其实也比较好理解，由于要保证数据的最终一致性，不少解决防范都会有不少重试的操做，若是一个方法不保证幂等，那么将没法被重试。幂等操做的实现方式有多种，如在系统中缓存全部的请求与处理结果、检测到重复操做后，直接返回上一次的处理结果等。

业界方案

两阶段提交（2PC）

XA是X/Open CAE Specification (Distributed Transaction Processing)模型中定义的TM（Transaction Manager）与RM（Resource Manager）之间进行通讯的接口。

在XA规范中，数据库充当RM角色，应用须要充当TM的角色，即生成全局的txId，调用XAResource接口，把多个本地事务协调为全局统一的分布式事务。

二阶段提交是XA的标准实现。它将分布式事务的提交拆分为2个阶段：prepare和commit/rollback。

2PC模型中，在prepare阶段须要等待全部参与子事务的反馈，所以可能形成数据库资源锁定时间过长，不适合并发高以及子事务生命周长较长的业务场景。两阶段提交这种解决方案属于牺牲了一部分可用性来换取的一致性。

saga

saga的提出，最先是为了解决可能会长时间运行的分布式事务（long-running process）的问题。所谓long-running的分布式事务，是指那些企业业务流程，须要跨应用、跨企业来完成某个事务，甚至在事务流程中还须要有手工操做的参与，这类事务的完成时间可能以分计，以小时计，甚至可能以天计。这类事务若是按照事务的ACID的要求去设计，势必形成系统的可用性大大的下降。试想一个由两台服务器一块儿参与的事务，服务器A发起事务，服务器B参与事务，B的事务须要人工参与，因此处理时间可能很长。若是按照ACID的原则，要保持事务的隔离性、一致性，服务器A中发起的事务中使用到的事务资源将会被锁定，不容许其余应用访问到事务过程当中的中间结果，直到整个事务被提交或者回滚。这就形成事务A中的资源被长时间锁定，系统的可用性将不可接受。

而saga，则是一种基于补偿的消息驱动的用于解决long-running process的一种解决方案。目标是为了在确保系统高可用的前提下尽可能确保数据的一致性。仍是上面的例子，若是用saga来实现，那就是这样的流程：服务器A的事务先执行，若是执行顺利，那么事务A就先行提交；若是提交成功，那么就开始执行事务B，若是事务B也执行顺利，则事务B也提交，整个事务就算完成。可是若是事务B执行失败，那事务B自己须要回滚，这时由于事务A已经提交，因此须要执行一个补偿操做，将已经提交的事务A执行的操做做反操做，恢复到未执行前事务A的状态。这样的基于消息驱动的实现思路，就是saga。咱们能够看出，saga是牺牲了数据的强一致性，仅仅实现了最终一致性，可是提升了系统总体的可用性。

补偿事务（TCC）

TCC 其实就是采用的补偿机制，其核心思想是：针对每一个操做，都要注册一个与其对应的确认和补偿（撤销）操做。TCC模型是把锁的粒度彻底交给业务处理。它分为三个阶段：

Try 阶段主要是对业务系统作检测及资源预留
Confirm 阶段主要是对业务系统作确认提交，Try阶段执行成功并开始执行 Confirm阶段时，默认 Confirm阶段是不会出错的。即：只要Try成功，Confirm必定成功。
Cancel 阶段主要是在业务执行错误，须要回滚的状态下执行的业务取消，预留资源释放。

下面对TCC模式下，A帐户往B帐户汇款100元为例子，对业务的改造进行详细的分析：

汇款服务和收款服务分别须要实现，Try-Confirm-Cancel接口，并在业务初始化阶段将其注入到TCC事务管理器中。

[汇款服务]
Try：
    检查A帐户有效性，即查看A帐户的状态是否为“转账中”或者“冻结”；
    检查A帐户余额是否充足；
    从A帐户中扣减100元，并将状态置为“转帐中”；
    预留扣减资源，将从A往B帐户转帐100元这个事件存入消息或者日志中；
Confirm：
	不作任何操做；
Cancel：
    A帐户增长100元；
	从日志或者消息中，释放扣减资源。

[收款服务]
Try：
	检查B帐户帐户是否有效；
Confirm：
    读取日志或者消息，B帐户增长100元；
    从日志或者消息中，释放扣减资源；
Cancel：
	不作任何操做。

　　由此能够看出，TCC模型对业务的侵入强，改造的难度大。

本地消息表（异步确保）

本地消息表这种实现方式应该是业界使用最多的，其核心思想是将分布式事务拆分红本地事务进行处理，这种思路是来源于ebay。咱们能够从下面的流程图中看出其中的一些细节：

基本思路就是：

消息生产方，须要额外建一个消息表，并记录消息发送状态。消息表和业务数据要在一个事务里提交，也就是说他们要在一个数据库里面。而后消息会通过MQ发送到消息的消费方。若是消息发送失败，会进行重试发送。

消息消费方，须要处理这个消息，并完成本身的业务逻辑。此时若是本地事务处理成功，代表已经处理成功了，若是处理失败，那么就会重试执行。若是是业务上面的失败，能够给生产方发送一个业务补偿消息，通知生产方进行回滚等操做。

生产方和消费方定时扫描本地消息表，把还没处理完成的消息或者失败的消息再发送一遍。若是有靠谱的自动对帐补帐逻辑，这种方案仍是很是实用的。

事务消息

事务消息做为一种异步确保型事务，将两个事务分支经过MQ进行异步解耦，事务消息的设计流程一样借鉴了两阶段提交理论，总体交互流程以下图所示：

事务发起方首先发送prepare消息到MQ。
在发送prepare消息成功后执行本地事务。
根据本地事务执行结果返回commit或者是rollback。
若是消息是rollback，MQ将删除该prepare消息不进行下发，若是是commit消息，MQ将会把这个消息发送给consumer端。
若是执行本地事务过程当中，执行端挂掉，或者超时，MQ将会不停的询问其同组的其它producer来获取状态。
Consumer端的消费成功机制有MQ保证。

有一些第三方的MQ是支持事务消息的，好比RocketMQ，可是市面上一些主流的MQ都是不支持事务消息的，好比 RabbitMQ 和 Kafka 都不支持。

尽最大努力通知

最大努力通知方案主要也是借助MQ消息系统来进行事务控制，这一点与可靠消息最终一致方案同样。看来MQ中间件确实在一个分布式系统架构中，扮演者重要的角色。最大努力通知方案是比较简单的分布式事务方案，它本质上就是经过按期校对，实现数据一致性。

最大努力通知方案的实现

业务活动的主动方，在完成业务处理以后，向业务活动的被动方发送消息，容许消息丢失。
主动方能够设置时间阶梯型通知规则，在通知失败后按规则重复通知，直到通知N次后再也不通知。
主动方提供校对查询接口给被动方按需校对查询，用于恢复丢失的业务消息。
业务活动的被动方若是正常接收了数据，就正常返回响应，并结束事务。
若是被动方没有正常接收，根据定时策略，向业务活动主动方查询，恢复丢失的业务消息

最大努力通知方案的特色

用到的服务模式：可查询操做、幂等操做。
被动方的处理结果不影响主动方的处理结果；
适用于对业务最终一致性的时间敏感度低的系统；
适合跨企业的系统间的操做，或者企业内部比较独立的系统间的操做，好比银行通知、商户通知等；

方案比较

属性	2PC	TCC	本地消息表	事务消息	尽最大努力通知
事务一致性	强	弱	弱	弱	弱
复杂性	中	高	低	低	低
业务侵入性	小	大	中	中	中
使用局限性	大	大	小	中	中
性能	低	中	高	高	高
维护成本	低	高	低	中	中

别人是怎么作的

alipay的分布式事务服务DTS

https://tech.antfin.com/docs/2/46887

分布式事务服务（Distributed Transaction Service，简称 DTS）是一个分布式事务框架，用来保障在大规模分布式环境下事务的最终一致性。DTS 从架构上分为 xts-client 和 xts-server 两部分，前者是一个嵌入客户端应用的 Jar 包，主要负责事务数据的写入和处理；后者是一个独立的系统，主要负责异常事务的恢复。

核心概念

在 DTS 内部，咱们将一个分布式事务的关联方，分为发起方和参与者两类：

发起方： 分布式事务的发起方负责启动分布式事务，触发建立相应的主事务记录。发起方是分布式事务的协调者，负责调用参与者的服务，并记录相应的事务日志，感知整个分布式事务状态来决定整个事务是 COMMIT 仍是 ROLLBACK。

**参与者：**参与者是分布式事务中的一个原子单位，全部参与者都必须在一阶段接口（Prepare）中标注（Annotation）参与者的标识，它定义了 prepare、commit、rollback 3个基本接口，业务系统须要实现这3个接口，并保证其业务数据的幂等性，也必须保证 prepare 中的数据操做可以被提交（COMMIT）或者回滚（ROLLBACK）。从存储结构上，DTS 的事务状态数据能够分为主事务记录（Activity）和分支事务记录（Action）两类：

**主事务记录 Activity：**主事务记录是整个分布式事务的主体，其最核心的数据结构是事务号（TX_ID）和事务状态（STATE），它是在启动分布式事务的时候持久化写入数据库的，它的状态决定了这笔分布式事务的状态。

**分支事务记录 Action：**分支事务记录是主事务记录的一个子集，它记录了一个参与者的信息，其中包括参与者的 NAME 名称，DTS 经过这个 NAME 来惟必定位一个参与者。经过这个分支事务信息，咱们就能够对参与者进行提交或者回滚操做。

这应该属于咱们上面所说的TCC模式。

eBay 本地消息表

https://www.infoq.cn/article/solution-of-distributed-system-transaction-consistency

本地消息表这种实现方式的思路，实际上是源于ebay，后来经过支付宝等公司的布道，在业内普遍使用。其基本的设计思想是将远程分布式事务拆分红一系列的本地事务。若是不考虑性能及设计优雅，借助关系型数据库中的表便可实现。

举个经典的跨行转帐的例子来描述。第一步，扣款1W，经过本地事务保证了凭证消息插入到消息表中。第二步，通知对方银行帐户上加1W了。那问题来了，如何通知到对方呢？

一般采用两种方式：

采用时效性高的MQ，由对方订阅消息并监听，有消息时自动触发事件
采用定时轮询扫描的方式，去检查消息表的数据。

相似使用本地消息表+消息通知的还有去哪儿，蘑菇街

各类第三方支付回调

最大努力通知型。如支付宝、微信的支付回调接口方式，不断回调直至成功，或直至调用次数衰减至失败状态。

咱们能够怎么来作

2PC/3PC须要资源管理器(mysql, redis)支持XA协议，且整个事务的执行期间须要锁住事务资源，会下降性能。故先排除。

TCC的模式，须要事务接口提供try,confirm,cancel三个接口，提升了编程的复杂性。须要依赖于业务方来配合提供这样的接口。推行难度大，暂时排除。

最大努力通知型，应用于异构或者服务平台当中

能够看到ebay的经典模式中，分布式的事务，是经过本地事务+可靠消息，来达到事务的最终一致性的。可是出现了事务消息，就把本地事务的工做给涵盖在事务消息当中了。因此，接下来要基于事务消息来套咱们的应用场景，看起是否知足咱们对分布式事务产品的要求。