03 | 事务隔离：为何你改了我还看不见？

时间 2019-11-26

原文原文链接

提到事务，你确定不陌生，和数据库打交道的时候，咱们老是会用到事务。最经典的例子就是转帐，你要给朋友小王转100块钱，而此时你的银行卡只有100块钱。mysql

转帐过程具体到程序里会有一系列的操做，好比查询余额、作加减法、更新余额等，这些操做必须保证是一体的，否则等程序查完以后，还没作减法以前，你这100块钱，彻底能够借着这个时间差再查一次，而后再给另一个朋友转帐，若是银行这么整，不就乱了么？这时就要用到“事务”这个概念了。sql

简单来讲，事务就是要保证一组数据库操做，要么所有成功，要么所有失败。在MySQL中，事务支持是在引擎层实现的。你如今知道，MySQL是一个支持多引擎的系统，但并非全部的引擎都支持事务。好比MySQL原生的MyISAM引擎就不支持事务，这也是MyISAM被InnoDB取代的重要缘由之一。数据库

今天的文章里，我将会以InnoDB为例，剖析MySQL在事务支持方面的特定实现，并基于原理给出相应的实践建议，但愿这些案例能加深你对MySQL事务原理的理解。并发

隔离性与隔离级别

提到事务，你确定会想到ACID（Atomicity、Consistency、Isolation、Durability，即原子性、一致性、隔离性、持久性），今天咱们就来讲说其中I，也就是“隔离性”。框架

当数据库上有多个事务同时执行的时候，就可能出现脏读（dirty read）、不可重复读（non-repeatable read）、幻读（phantom read）的问题，为了解决这些问题，就有了“隔离级别”的概念。线程

在谈隔离级别以前，你首先要知道，你隔离得越严实，效率就会越低。所以不少时候，咱们都要在两者之间寻找一个平衡点。SQL标准的事务隔离级别包括：读未提交（read uncommitted）、读提交（read committed）、可重复读（repeatable read）和串行化（serializable ）。下面我逐一为你解释：日志

读未提交是指，一个事务还没提交时，它作的变动就能被别的事务看到。
读提交是指，一个事务提交以后，它作的变动才会被其余事务看到。
可重复读是指，一个事务执行过程当中看到的数据，老是跟这个事务在启动时看到的数据是一致的。固然在可重复读隔离级别下，未提交变动对其余事务也是不可见的。
串行化，顾名思义是对于同一行记录，“写”会加“写锁”，“读”会加“读锁”。当出现读写锁冲突的时候，后访问的事务必须等前一个事务执行完成，才能继续执行。

其中“读提交”和“可重复读”比较难理解，因此我用一个例子说明这几种隔离级别。假设数据表T中只有一列，其中一行的值为1，下面是按照时间顺序执行两个事务的行为。code

mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);

咱们来看看在不一样的隔离级别下，事务A会有哪些不一样的返回结果，也就是图里面V一、V二、V3的返回值分别是什么。orm

若隔离级别是“读未提交”，则V1的值就是2。这时候事务B虽然尚未提交，可是结果已经被A看到了。所以，V二、V3也都是2。
若隔离级别是“读提交”，则V1是1，V2的值是2。事务B的更新在提交后才能被A看到。因此， V3的值也是2。
若隔离级别是“可重复读”，则V一、V2是1，V3是2。之因此V2仍是1，遵循的就是这个要求：事务在执行期间看到的数据先后必须是一致的。
若隔离级别是“串行化”，则在事务B执行“将1改为2”的时候，会被锁住。直到事务A提交后，事务B才能够继续执行。因此从A的角度看， V一、V2值是1，V3的值是2。

在实现上，数据库里面会建立一个视图，访问的时候以视图的逻辑结果为准。在“可重复读”隔离级别下，这个视图是在事务启动时建立的，整个事务存在期间都用这个视图。在“读提交”隔离级别下，这个视图是在每一个SQL语句开始执行的时候建立的。这里须要注意的是，“读未提交”隔离级别下直接返回记录上的最新值，没有视图概念；而“串行化”隔离级别下直接用加锁的方式来避免并行访问。blog

咱们能够看到在不一样的隔离级别下，数据库行为是有所不一样的。Oracle数据库的默认隔离级别其实就是“读提交”，所以对于一些从Oracle迁移到MySQL的应用，为保证数据库隔离级别的一致，你必定要记得将MySQL的隔离级别设置为“读提交”。

配置的方式是，将启动参数transaction-isolation的值设置成READ-COMMITTED。你能够用show variables来查看当前的值。

mysql> show variables like 'transaction_isolation';

+-----------------------+----------------+

| Variable_name | Value |

+-----------------------+----------------+

| transaction_isolation | READ-COMMITTED |

+-----------------------+----------------+

总结来讲，存在即合理，哪一个隔离级别都有它本身的使用场景，你要根据本身的业务状况来定。我想你可能会问那何时须要“可重复读”的场景呢？咱们来看一个数据校对逻辑的案例。

假设你在管理一个我的银行帐户表。一个表存了每月月底的余额，一个表存了帐单明细。这时候你要作数据校对，也就是判断上个月的余额和当前余额的差额，是否与本月的帐单明细一致。你必定但愿在校对过程当中，即便有用户发生了一笔新的交易，也不影响你的校对结果。

这时候使用“可重复读”隔离级别就很方便。事务启动时的视图能够认为是静态的，不受其余事务更新的影响。

事务隔离的实现

理解了事务的隔离级别，咱们再来看看事务隔离具体是怎么实现的。这里咱们展开说明“可重复读”。

在MySQL中，实际上每条记录在更新的时候都会同时记录一条回滚操做。记录上的最新值，经过回滚操做，均可以获得前一个状态的值。

假设一个值从1被按顺序改为了二、三、4，在回滚日志里面就会有相似下面的记录。

当前值是4，可是在查询这条记录的时候，不一样时刻启动的事务会有不一样的read-view。如图中看到的，在视图A、B、C里面，这一个记录的值分别是一、二、4，同一条记录在系统中能够存在多个版本，就是数据库的多版本并发控制（MVCC）。对于read-view A，要获得1，就必须将当前值依次执行图中全部的回滚操做获得。

同时你会发现，即便如今有另一个事务正在将4改为5，这个事务跟read-view A、B、C对应的事务是不会冲突的。

你必定会问，回滚日志总不能一直保留吧，何时删除呢？答案是，在不须要的时候才删除。也就是说，系统会判断，当没有事务再须要用到这些回滚日志时，回滚日志会被删除。

何时才不须要了呢？就是当系统里没有比这个回滚日志更早的read-view的时候。

基于上面的说明，咱们来讨论一下为何建议你尽可能不要使用长事务。

长事务意味着系统里面会存在很老的事务视图。因为这些事务随时可能访问数据库里面的任何数据，因此这个事务提交以前，数据库里面它可能用到的回滚记录都必须保留，这就会致使大量占用存储空间。

在MySQL 5.5及之前的版本，回滚日志是跟数据字典一块儿放在ibdata文件里的，即便长事务最终提交，回滚段被清理，文件也不会变小。我见过数据只有20GB，而回滚段有200GB的库。最终只好为了清理回滚段，重建整个库。

除了对回滚段的影响，长事务还占用锁资源，也可能拖垮整个库，这个咱们会在后面讲锁的时候展开。

事务的启动方式

如前面所述，长事务有这些潜在风险，我固然是建议你尽可能避免。其实不少时候业务开发同窗并非有意使用长事务，一般是因为误用所致。MySQL的事务启动方式有如下几种：

显式启动事务语句， begin 或 start transaction。配套的提交语句是commit，回滚语句是rollback。
set autocommit=0，这个命令会将这个线程的自动提交关掉。意味着若是你只执行一个select语句，这个事务就启动了，并且并不会自动提交。这个事务持续存在直到你主动执行commit 或 rollback 语句，或者断开链接。

有些客户端链接框架会默认链接成功后先执行一个set autocommit=0的命令。这就致使接下来的查询都在事务中，若是是长链接，就致使了意外的长事务。

所以，我会建议你老是使用set autocommit=1, 经过显式语句的方式来启动事务。

可是有的开发同窗会纠结“多一次交互”的问题。对于一个须要频繁使用事务的业务，第二种方式每一个事务在开始时都不须要主动执行一次 “begin”，减小了语句的交互次数。若是你也有这个顾虑，我建议你使用commit work and chain语法。

在autocommit为1的状况下，用begin显式启动的事务，若是执行commit则提交事务。若是执行 commit work and chain，则是提交事务并自动启动下一个事务，这样也省去了再次执行begin语句的开销。同时带来的好处是从程序开发的角度明确地知道每一个语句是否处于事务中。

你能够在information_schema库的innodb_trx这个表中查询长事务，好比下面这个语句，用于查找持续时间超过60s的事务。

select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(),trx_started))>60

小结

这篇文章里面，我介绍了MySQL的事务隔离级别的现象和实现，根据实现原理分析了长事务存在的风险，以及如何用正确的方式避免长事务。但愿我举的例子可以帮助你理解事务，并更好地使用MySQL的事务特性。

我给你留一个问题吧。你如今知道了系统里面应该避免长事务，若是你是业务开发负责人同时也是数据库负责人，你会有什么方案来避免出现或者处理这种状况呢？

你能够把你的思考和观点写在留言区里，我会在下一篇文章的末尾和你讨论这个问题。感谢你的收听，也欢迎你把这篇文章分享给更多的朋友一块儿阅读。

上期问题时间

在上期文章的最后，我给你留下的问题是一天一备跟一周一备的对比。

好处是“最长恢复时间”更短。

在一天一备的模式里，最坏状况下须要应用一天的binlog。好比，你天天0点作一次全量备份，而要恢复出一个到昨天晚上23点的备份。

一周一备最坏状况就要应用一周的binlog了。

系统的对应指标就是 @尼古拉斯·赵四 @慕塔提到的RTO（恢复目标时间）。

固然这个是有成本的，由于更频繁全量备份须要消耗更多存储空间，因此这个RTO是成本换来的，就须要你根据业务重要新来评估了。