(一)基础概念:↓ ↓ ↓数据库
什么是事务?举个生活中的例子:你去小卖铺买东西,“一手交钱,一手交货”就是一个事务的例子,交钱和交货必 须所有成功,服务器
事务才算成功,任一个活动失败,事务将撤销全部已成功的活动。 网络
明白上述例子,再来看事务的定义:架构
在计算机系统中,更多的是经过关系型数据库来控制事务,这是利用数据库自己的事务特性来实现的,所以叫数据 库事务,因为应用主要靠关系数据库来控制事务,并发
而数据库一般和应用在同一个服务器,因此基于关系型数据库的 事务又被称为本地事务。异步
回顾一下数据库事务的四大特性 ACID:分布式
A :(Atomic):原子性,构成事务的全部操做,要么都执行完成,要么所有不执行,不可能出现部分红功部分失 败的状况。ide
C :(Consistency):一致性,在事务执行先后,数据库的一致性约束没有被破坏。好比:张三向李四转100元, 转帐前和转帐后的数据是正确状态这叫一致性,微服务
若是出现张三转出100元,李四帐户没有增长100元这就出现了数 据错误,就没有达到一致性。性能
I :(Isolation):隔离性,数据库中的事务通常都是并发的,隔离性是指并发的两个事务的执行互不干扰,一个事 务不能看到其余事务运行过程的中间状态。经过配置事务隔离级别能够避脏读、重复读等问题。
D :(Durability):持久性,事务完成以后,该事务对数据的更改会被持久化到数据库,且不会被回滚。
数据库事务在实现时会将一次事务涉及的全部操做所有归入到一个不可分割的执行单元,该执行单元中的全部操做 要么都成功,要么都失败,只要其中任一操做执行失败,都将致使整个事务的回滚
1.三、分布式事务
随着互联网的快速发展,软件系统由原来的单体应用转变为分布式应用,下图描述了单体应用向微服务的演变
分布式系统会把一个应用系统拆分为可独立部署的多个服务,所以须要服务与服务之间远程协做才能完成事务操 做,
这种分布式系统环境下由不一样的服务之间经过网络远程协做完成事务称之为分布式事务,
例如用户注册送积分 事务、建立订单减库存事务,银行转帐事务等都是分布式事务。
咱们知道本地事务依赖数据库自己提供的事务特性来实现,所以如下逻辑能够控制本地事务:
begin transaction; //1.本地数据库操做:张三减小金额 //2.本地数据库操做:李四增长金额
commit transation;
begin transaction; //1.本地数据库操做:张三减小金额 //2.远程调用:让李四增长金额
commit transation;
能够设想,当远程调用让李四增长金额成功了,因为网络问题远程调用并无返回,此时本地事务提交失败就回滚 了张三减小金额的操做,此时张三和李四的数据就不一致了。
所以在分布式架构的基础上,传统数据库事务就没法使用了,张三和李四的帐户不在一个数据库中甚至不在一个应 用系统里,实现转帐事务须要经过远程调用,因为网络问题就会致使分布式事务问题。
1.四、 分布式事务产生的场景
1):典型的场景就是微服务架构 微服务之间经过远程调用完成事务操做。
好比:订单微服务和库存微服务,下单的 同时订单微服务请求库存微服务减库存。
简言之:跨JVM进程产生分布式事务。
2):单体系统访问多个数据库实例 当单体系统须要访问多个数据库(实例)时就会产生分布式事务。
好比:用户信 息和订单信息分别在两个MySQL实例存储,用户管理系统删除用户信息,须要分别删除用户信息及用户的订单信 息,
因为数据分布在不一样的数据实例,须要经过不一样的数据库连接去操做数据,此时产生分布式事务。
简言之:跨 数据库实例产生分布式事务。
3):多服务访问同一个数据库实例 好比:
订单微服务和库存微服务即便访问同一个数据库也会产生分布式事务,原 因就是跨JVM进程,两个微服务持有了不一样的数据库连接进行数据库操做,此时产生分布式事务。
=========================== 华丽分割线 ==========================
(二)分布式事务基础理论:↓ ↓ ↓
经过前面的学习,咱们了解到了分布式事务的基础概念。
与本地事务不一样的是,分布式系统之因此叫分布式,是因 为提供服务的各个节点分布在不一样机器上,相互之间经过网络交互。
不能由于有一点网络问题就致使整个系统没法 提供服务,网络因素成为了分布式事务的考量标准之一。
所以,分布式事务须要更进一步的理论支持,接下来,我 们先来学习一下分布式事务的CAP理论。↓ ↓ ↓
在讲解分布式事务控制解决方案以前须要先学习一些基础理论,经过理论知识指导咱们肯定分布式事务控制的目 标,从而帮助咱们理解每一个解决方案。
2.1):CAP理论
2.1.1):理解CAP
CAP是 Consistency、Availability、Partition tolerance 三个词语的缩写,分别表示一致性、可用性、分区容忍 性。
下边咱们分别来解释: 为了方便对CAP理论的理解,咱们结合电商系统中的一些业务场景来理解CAP。
以下图,是商品信息管理的执行流程 ↓ ↓ ↓
总体执行流程以下:
一、商品服务请求主数据库写入商品信息(添加商品、修改商品、删除商品)
二、主数据库向商品服务响应写入成功。
三、商品服务请求从数据库读取商品信息。
C - Consistency:
一致性是指写操做后的读操做能够读取到最新的数据状态,当数据分布在多个节点上,从任意结点读取到的数据都 是最新的状态。
上图中,商品信息的读写要知足一致性就是要实现以下目标:
一、商品服务写入主数据库成功,则向从数据库查询新数据也成功。
二、商品服务写入主数据库失败,则向从数据库查询新数据也失败。
如何实现一致性?
一、写入主数据库后要将数据同步到从数据库。
二、写入主数据库后,在向从数据库同步期间要将从数据库锁定,待同步完成后再释放锁,以避免在新数据写入成功 后,向从数据库查询到旧的数据。
分布式系统一致性的特色:
一、因为存在数据同步的过程,写操做的响应会有必定的延迟。
二、为了保证数据一致性会对资源暂时锁定,待数据同步完成释放锁定资源。
三、若是请求数据同步失败的结点则会返回错误信息,必定不会返回旧数据。
A - Availability :
可用性是指任何事务操做均可以获得响应结果,且不会出现响应超时或响应错误。
上图中,商品信息读取知足可用性就是要实现以下目标:
一、从数据库接收到数据查询的请求则当即可以响应数据查询结果。
二、从数据库不容许出现响应超时或响应错误。
如何实现可用性?
一、写入主数据库后要将数据同步到从数据库。
二、因为要保证从数据库的可用性,不可将从数据库中的资源进行锁定。
三、即时数据尚未同步过来,从数据库也要返回要查询的数据,哪怕是旧数据,若是连旧数据也没有则能够按照 约定返回一个默认信息,但不能返回错误或响应超时。
分布式系统可用性的特色:
一、 全部请求都有响应,且不会出现响应超时或响应错误。
P - Partition tolerance :
一般分布式系统的各各结点部署在不一样的子网,这就是网络分区,不可避免的会出现因为网络问题而致使结点之间 通讯失败,此时仍可对外提供服务,这叫分区容忍性。
上图中,商品信息读写知足分区容忍性就是要实现以下目标:
一、主数据库向从数据库同步数据失败不影响读写操做。
二、其一个结点挂掉不影响另外一个结点对外提供服务。
如何实现分区容忍性?
一、尽可能使用异步取代同步操做,例如使用异步方式将数据从主数据库同步到从数据,这样结点之间能有效的实现 松耦合。
二、添加从数据库结点,其中一个从结点挂掉其它从结点提供服务。
分布式分区容忍性的特色:
一、分区容忍性分是布式系统具有的基本能力。
2.1.2):CAP组合方式
一、上边商品管理的例子是否同时具有 CAP呢?
在全部分布式事务场景中不会同时具有CAP三个特性,由于在具有了P的前提下C和A是不能共存的。
好比: 下图知足了P即表示实现分区容忍:
本图分区容忍的含义是:
1)主数据库经过网络向从数据同步数据,能够认为主从数据库部署在不一样的分区,经过网络进行交互。
2)当主数据库和从数据库之间的网络出现问题不影响主数据库和从数据库对外提供服务。
3)其一个结点挂掉不影响另外一个结点对外提供服务。
若是要实现C则必须保证数据一致性,在数据同步的时候为防止向从数据库查询不一致的数据则须要将从数据库数 据锁定,待同步完成后解锁,
若是同步失败从数据库要返回错误信息或超时信息。 若是要实现A则必须保证数据可用性,无论任什么时候候均可以向从数据查询数据,则不会响应超时或返回错误信息。
经过分析发如今知足P的前提下C和A存在矛盾性。
二、CAP有哪些组合方式呢?
因此在生产中对分布式事务处理时要根据需求来肯定知足CAP的哪两个方面。
1)AP:
放弃一致性,追求分区容忍性和可用性。这是不少分布式系统设计时的选择。
例如: 上边的商品管理,彻底能够实现AP,前提是只要用户能够接受所查询的到数据在必定时间内不是最新的便可。
一般实现AP都会保证最终一致性,后面讲的BASE理论就是根据AP来扩展的,一些业务场景,
好比:订单退款,今 日退款成功,明日帐户到帐,只要用户能够接受在必定时间内到帐便可。
2)CP:
放弃可用性,追求一致性和分区容错性,咱们的zookeeper其实就是追求的强一致,又好比跨行转帐,一次转帐请 求要等待双方银行系统都完成整个事务才算完成。
3)CA:
放弃分区容忍性,即不进行分区,不考虑因为网络不通或结点挂掉的问题,则能够实现一致性和可用性。
那么系统 将不是一个标准的分布式系统,咱们最经常使用的关系型数据就知足了CA。
上边的商品管理,若是要实现CA则架构以下:↓ ↓ ↓
主数据库和从数据库中间再也不进行数据同步,数据库能够响应每次的查询请求,经过事务隔离级别实现每一个查询请 求均可以返回最新的数据。
2.1.3 ):总结
经过上面咱们已经学习了CAP理论的相关知识,CAP是一个已经被证明的理论:
一个分布式系统最多只能同时知足 一致性(Consistency)、可用性(Availability)和分区容忍性(Partition tolerance)这三项中的两项。
它能够做 为咱们进行架构设计、技术选型的考量标准。对于多数大型互联网应用的场景,结点众多、部署分散,并且如今的 集群规模愈来愈大,因此节点故障、网络故障是常态,并且要保证服务可用性达到N个9(99.99..%),并要达到良 好的响应性能来提升用户体验,所以通常都会作出以下选择:保证P和A,舍弃C强一致,保证最终一致性。
2.2):BASE 理论
一、理解强一致性和最终一致性
CAP理论告诉咱们一个分布式系统最多只能同时知足一致性(Consistency)、可用性(Availability)和分区容忍 性(Partition tolerance)这三项中的两项,其中AP在实际应用中较多,AP即舍弃一致性,保证可用性和分区容忍 性,可是在实际生产中不少场景都要实现一致性,好比前边咱们举的例子主数据库向从数据库同步数据,即便不要 一致性,可是最终也要将数据同步成功来保证数据一致,这种一致性和CAP中的一致性不一样,CAP中的一致性要求 在任什么时候间查询每一个结点数据都必须一致,它强调的是强一致性,可是最终一致性是容许能够在一段时间内每一个结 点的数据不一致,可是通过一段时间每一个结点的数据必须一致,它强调的是最终数据的一致性。
二、Base理论介绍
BASE 是 Basically Available(基本可用)、Soft state(软状态)和 Eventually consistent (最终一致性)三个短语的缩 写。
BASE理论是对CAP中AP的一个扩展,经过牺牲强一致性来得到可用性,当出现故障容许部分不可用但要保证 核心功能可用,容许数据在一段时间内是不一致的,但最终达到一致状态。知足BASE理论的事务,咱们称之为“柔 性事务”。
~ 基本可用:分布式系统在出现故障时,容许损失部分可用功能,保证核心功能可用。如,电商网站交易付款出 现问题了,商品依然能够正常浏览。
~ 软状态:因为不要求强一致性,因此BASE容许系统中存在中间状态(也叫软状态),这个状态不影响系统可用 性,如订单的"支付中"、“数据同步中”等状态,
待数据最终一致后状态改成“成功”状态。
~ 最终一致:最终一致是指通过一段时间后,全部节点数据都将会达到一致。
如订单的"支付中"状态,最终会变 为“支付成功”或者"支付失败",使订单状态与实际交易结果达成一致,但须要必定时间的延迟、等待。
=========================== 华丽分割线 ==========================
(三)分布式事务解决方案之2PC(两阶段提交) :↓ ↓ ↓
前面已经学习了分布式事务的基础理论,以理论为基础,针对不一样的分布式场景业界常见的解决方案有2PC、 TCC、可靠消息最终一致性、最大努力通知这几种。
3.1):什么是2PC
2PC即两阶段提交协议,是将整个事务流程分为两个阶段,准备阶段(Prepare phase)、提交阶段(commit phase),2是指两个阶段,P是指准备阶段,C是指提交阶段。
举例:张三和李四很久不见,老友约起聚餐,饭店老板要求先买单,才能出票。这时张三和李四分别抱怨近况不如 意,囊中羞涩,都不肯意请客,这时只能AA。只有张三和李四都付款,老板才能出票安排就餐。但因为张三和李四 都是铁公鸡,造成了尴尬的一幕:
· 准备阶段:老板要求张三付款,张三付款。老板要求李四付款,李四付款。
· 提交阶段:老板出票,两人拿票纷纷落座就餐。
例子中造成了一个事务,若张三或李四其中一人拒绝付款,或钱不够,店老板都不会给出票,而且会把已收款退 回。
整个事务过程由事务管理器和参与者组成,店老板就是事务管理器,张3、李四就是事务参与者,事务管理器负责 决策整个分布式事务的提交和回滚,事务参与者负责本身本地事务的提交和回滚。
在计算机中部分关系数据库如Oracle、MySQL支持两阶段提交协议,以下图:↓ ↓ ↓
1. 准备阶段(Prepare phase):事务管理器给每一个参与者发送Prepare消息,每一个数据库参与者在本地执行事 务,并写本地的Undo/Redo日志,此时事务没有提交。
(Undo日志是记录修改前的数据,用于数据库回滚,Redo日志是记录修改后的数据,用于提交事务后写入数 据文件)
2. 提交阶段(commit phase):若是事务管理器收到了参与者的执行失败或者超时消息时,直接给每一个参与者 发送回滚(Rollback)消息;
不然,发送提交(Commit)消息;参与者根据事务管理器的指令执行提交或者回滚操 做,并释放事务处理过程当中使用的锁资源。注意:必须在最后阶段释放锁资源。
下图展现了2PC的两个阶段,分红功和失败两个状况说明: 成功状况:
Face your past without regret. Handle your present with confidence.Prepare for future without fear. keep the faith and drop the fear.
面对过去无怨无悔,把握如今充满信心,备战将来无所畏惧。保持信念,克服恐惧!一点一滴的积累,一点一滴的沉淀,学技术须要不断的积淀!