答:指一次大的操做由不一样的小操做组成的,这些小的操做分布在不一样的服务器上,分布式事务须要保证这些小操做要么所有成功,要么所有失败。从本质上来讲,分布式事务就是为了保证不一样数据库的数据一致性。html
当数据库单表数据达到千万级别,就要考虑分库分表,那么就会从原来的一个数据库变成多个数据库。例如若是一个操做即操做了01库,又操做了02库,并且又要保证数据的一致性,那么就要用到分布式事务。sql
所谓的SOA化,就是业务的服务化。例如电商平台下单操做就会产生调用库存服务扣减库存和订单服务更新订单数据,那么就会设计到订单数据库和库存数据库,为了保证数据的一致性,就须要用到分布式事务。数据库
总结:其实上面两种场景,归根究竟是要操做多数据库,而且要保证数据的一致性,而产生的分布式事务的。服务器
XA是一个分布式事务协议,由Tuxedo提出。XA中大体分为两部分:事务管理器和本地资源管理器。其中本地资源管理器每每由数据库实现,好比Oracle、Mysql等数据库都实现了XA接口,而事务管理器做为全局的调度者,负责各个本地资源的提交回滚。网络
XA实现分布式事务的原理以下:并发
二阶段提交看起来确实可以提供原子性的操做,可是它存在几个缺点:分布式
一、同步阻塞问题:执行过程当中,全部参与节点都是事务阻塞型的。当参与者占有公共资源时,其余第三方节点访问公共资源不得不处于阻塞状态。高并发
二、单点故障:因为(事务管理器)协调者的重要性,一旦协调者发生故障。(本地资源管理器)参与者会一直阻塞下去。尤为在第二阶段,协调者发生故障,那么全部的参与者还都处于锁定事务资源的状态中,而没法继续完成事务操做。(若是是协调者挂掉,能够从新选举一个协调者,可是没法解决由于协调者宕机致使的参与者处于阻塞状态的问题)性能
三、数据不一致:在二阶段提交的阶段二中,当协调者向参与者发送commit请求以后,发生了局部网络异常或者在发送commit请求过程当中协调者发生了故障,这会致使只有一部分参与者接收到了commit请求。而在这部分参与者接到commit请求以后就会执行commit操做。可是其余部分未接到commit请求的机器没法执行事务提交。因而整个分布式系统便出现了数据不一致的现象。优化
四、二阶段没法解决的问题:参与者在发出commit消息以后宕机,而惟一接收到这条消息的协调者同时也宕机了。那么即便协调者经过选举协议产生了新的协调者,这条事务的状态也是不肯定的,没人知道事务是否被已经提交了。
3PC其实在2PC的基础上增长了CanCommit阶段,是2PC的变种,并引入了超时机制。一旦事务参与者迟迟没有收到协调者的Commit请求,就会自动进行本地commit,这样相对有效的解决了协调者单点故障的问题。可是,性能和数据一致性问题没有根本解决。
3PC分为三个阶段:CanCommit、PreCommit、DoCommit
它跟2PC的 准备阶段很像,协调者向参与者发送commit请求,参与者若是能够提交就返回Yes响应,不然返回No响应。
协调者根据参与者的响应状况来决定是否能够进行事务的PreCommit操做。根据响应状况,有如下两种可能:
该阶段进行真正的事务提交,也能够分为如下两种状况:
相对于2PC而言,3PC对于协调者和参与者都设置了超时时间,而2PC只有协调者才拥有超时时间机制。这个优化解决了,参与者在长时间没法与协调者节点通信的状况下,没法释放资源的问题,由于参与者自身拥有超时机制会在超时后,自动进行本地commit从而进行释放资源。而这种机制也侧面下降了整个事务的阻塞时间和范围。可是仍然没有解决数据一致性问题,即在参与者收到PreCommit请求后等待最终指令,若是此时协调者没法与参与者正常通讯,会致使参与者继续提交事务,形成数据不一致。
TCC(Try-Confirm-Cancel)又称补偿事务。它实际上与2PC、3PC同样,都是分布式事务的一种实现方案而已。它分为三个操做:
TCC事务的处理流程与2PC两阶段提交相似,不过2PC一般都是在DB层面,而TCC本质上就是应用层面的2PC,须要经过业务逻辑来实现。它的优点在于,可让应用本身定义数据库操做的粒度,使得下降锁冲突、提交吞吐量。
不过对应用的侵入性很是强,业务逻辑的每一个分支都须要实现try、confirm、cancel三个操做。
所谓的消息事务就是基于消息中间件的两阶段提交,本质上是中间件的一种特殊利用,他是将本地事务和发消息放在一个分布式事务里,保证要么本地操做成功而且对外发消息成功,要么二者都失败,开源的RocketMQ就支持这一特性,具体原理以下:
步骤以下:
一、:服务A向消息中间件发送一条预备消息。
二、消息中间件保存预备消息并返回成功。
三、服务A执行本地事务。
四、服务A发送提交消息给消息中间件,服务B接收到消息以后执行本地事务。
基于消息中间件的两阶段提交每每用在高并发场景下,将一个分布式事务拆成一个消息事务(服务A的本地操做+发消息)+服务B的本地操做,其中服务B的操做由消息驱动,只要消息事务成功,那么服务A必定成功,消息也必定发出来了,这时候服务B会收到消息去执行本地操做,若是本地操做失败,消息会重投,直到服务B操做成功,这样就变相地实现了A与B的分布式事务。
以上几个步骤可能存在异常状况,如今对其进行分析:
参考文章:
一、https://www.cnblogs.com/xifenglou/p/8440836.html
二、https://blog.csdn.net/skyie53101517/article/details/80741868
三、https://www.cnblogs.com/zcjcsl/p/7989792.html