数据库事务和MVCC多版本并发控制

事务特性

  • Atomicity(原子性)html

    一个事务必须被视为一个不可分割的最小工做单位,整个事务中的全部操做要么所有提交成功,要么所有失败回滚。c++

  • Consistency(一致性)sql

    数据库老是从一个一致性状态转换到另外一个一致性状态,事务执行以前和执行以后都必须处于一致性状态。数据库

  • Isolation(隔离性)segmentfault

    一般来讲,一个事务所作的修改在最终提交以前,对其它事务是不可见的。关于事务的隔离性,数据库提供了多种隔离级别。并发

  • Durability(持久性)性能

    一旦事务提交,则其所作的修改就会永久保存到数据库中。即使是数据库系统遇到故障的状况下也不会丢失。this

并发事务的问题

  • 脏读

一个事务正在对一条记录进行修改,在这个事务完成并提交前,这条记录的数据就处于不一致状态。这时,另外一个事务也来读取同一条记录,若是不加控制,第二个事务读取了这些“脏”数据,并据此作进一步的处理,就会产生未提交的数据依赖关系。spa

时间 事务A 事务B
T1 开启事务 开启事务
T2 查询帐户余额为1000
T3 充值500,余额修改成1500
T4 查询余额为1500
T5 撤销事务,余额改回1000
T6 汇入500,余额修改成2000
T7 提交事务
  • 不可重复读

一个事务在读取某些数据后的某个时间,再次读取之前读过的数据,却发现其读出的数据已经发生了变动、或者某些记录已经被删除了。3d

时间 事务A 事务B
T1 开启事务 开启事务
T2 select * from user where user_id=100 假设为小明的用户信息
T3 将user_id=100的用户信息对应的年龄修改成18
T4 提交事务
T5 再次查询发现用户的年龄变动
T6 ...
T7 提交事务
  • 幻读

一个事务按相同的查询条件从新读取之前检索过的数据,却发现其它事务插入了知足其查询条件的新数据。

时间 事务A 事务B
T1 开启事务 开启事务
T2 select * from user where age=18 假设获得两条记录
T3 向user表插入一条age=18的新记录
T4 提交事务
T5 再次查询获得三条记录
T6 ..
T7 提交事务

幻读和不可重复读的区别

  • 不可重复读的重点是修改:在同一事务中,相同的条件,第一次和第二次读到的数据不一致(中间有其它事务提交了修改)。
  • 幻读的重点是新增或者删除:在同一事务中,相同的条件,第一次和第二次读到的记录数不同(中间有其它事务提交了新增或者删除)。

事务隔离级别

SQL标准定义了4类隔离级别,每一种级别都规定了一个事务中所作的修改,哪些在事务内和事务间是可见的,哪些是不可见的。

  • Read Uncommited

全部事务均可以看到其它未提交事务的执行结果,该隔离级别通常不会使用。

  • Read Committed(RC)

一个事务只能看到已经提交的事务所作的变动。

  • Repeatable Read(RR)

确保同一事务的多个实例在并发读取数据时会看到相同的数据行。

  • Serializable

彻底串行化读,每次读都须要得到表级共享锁,读写相互阻塞。

隔离级别 脏读 不可重复读 幻读
Read Uncommited Yes Yes Yes
Read Committed No Yes Yes
Repeatable Read No No Yes
Serializable No No No

并发事务解决方案

脏读、不可重复读和幻读都是数据库读一致性问题,须要由数据库提供必定的事务隔离机制来解决。

(1)锁机制

解决写-写冲突问题。在读取数据前,对其加锁,防止其它事务对该数据进行修改。

  • 悲观锁

    每每依靠数据库提供的锁机制。

  • 乐观锁

    大可能是基于数据版本记录机制来实现。

(2)MVCC多版本并发控制

解决读-写冲突问题。不用加锁,经过必定机制生成一个数据请求时间点时的一致性数据快照, 并用这个快照来提供必定级别 (语句级或事务级) 的一致性读取。这样在读操做的时候不须要阻塞写操做,写操做时不须要阻塞读操做。

MVCC多版本并发控制

Mysql的大多数事务型存储引擎实现都不是简单的行级锁,基于并发性能考虑,通常都实现了MVCC多版本并发控制。MVCC是经过保存数据在某个时间点的快照来实现的。无论事务执行多长时间,事务看到的数据都是一致的。

读操做

读操做分红两类:快照读和当前读。

快照读:简单的select操做属于快照读,不加锁。

  • select * from table where ? ;

当前读:特殊的读操做,插入/更新/删除操做,属于当前读,须要加锁。

  • select * from table where ? lock in share mode ;
  • select * from table where ? for update ;
  • update table set ? where ? ;
  • delete from table where ? ;

数据存储

innodb存储引擎中,每行数据都包含了一些隐藏字段:DB_ROW_ID、DB_TRX_ID、DB_ROLL_PTR和DELETE_BIT。

数据库存储结构

  • DB_TRX_ID:用来标识最近一次对本行记录作修改的事务的标识符,即最后一次修改本行记录的事务id。delete操做在内部来看是一次update操做,更新行中的删除标识位DELELE_BIT。
  • DB_ROLL_PTR:指向当前数据的undo log记录,回滚数据经过这个指针来寻找记录被更新以前的内容信息。
  • DB_ROW_ID:包含一个随着新行插入而单调递增的行ID, 当由innodb自动产生汇集索引时,汇集索引会包括这个行ID的值,不然这个行ID不会出如今任何索引中。
  • DELELE_BIT:用于标识该记录是否被删除。

数据操做

  • insert

    建立一条记录,DB_TRX_ID为当前事务ID,DB_ROLL_PTR为NULL。

  • delete

    将当前行的DB_TRX_ID设置为当前事务ID,DELELE_BIT设置为1。

  • update 复制一行,新行的DB_TRX_ID为当前事务ID,DB_ROLL_PTR指向上个版本的记录,事务提交后DB_ROLL_PTR设置为NULL。

  • select

    一、只查找建立早于当前事务ID的记录,确保当前事务读取到的行都是事务以前就已经存在的,或者是由当前事务建立或修改的;

    二、行的DELETE BIT为1时,查找删除晚于当前事务ID的记录,确保当前事务开始以前,行没有被删除。

一致性读

Mysql的一致性读是经过read view结构来实现。 read view主要是用来作可见性判断的,它维护的是本事务不可见的当前其余活跃事务。其中最先的事务ID为up_limit_id,最迟的事务ID为low_limit_id

trx_id_t	low_limit_id;
				/*!< The read should not see any transaction with trx id >= this value. In other words, this is the "high water mark". */
	trx_id_t	up_limit_id;
				/*!< The read should see all trx ids which are strictly smaller (<) than this value. In other words, this is the "low water mark". */
复制代码

如何理解low_limit_id

能够参考知乎这个答案来理解。low_limit_id应该是当前系统还没有分配的下一个事务ID(从这个语义来更容易理解),也就是目前已经出现过的事务ID的最大值+1

MySQL 在 RC 隔离级别下是如何实现读不阻塞的? 呵呵一笑百媚生的答案

low_limit_id理解

可见性判断

假设要读取的行的最后提交事务id(即当前数据行的稳定事务id)为 trx_id,可见性比较过程以下:

  1. trx_id < up_limit_id => 此记录的最后一次修改在read view建立以前,跳转到步骤5;
  2. trx_id > low_limit_id => 此记录的最后一次修改在read view建立以后,跳转到步骤4;
  3. up_limit_id <= trx_id <= low_limit_id => 从up_limit_id到low_limit_id进行遍历,若是trx_id等于他们之中的某个事务id的话,表示该记录的最后一次修改还没有保存,跳转到步骤4。不然跳转到步骤5;
  4. 今后记录的DB_ROLL_PTR指针所指向的undo log(此记录的上一次修改),将undo log的DB_TRX_ID赋值给trx_id,跳转到步骤1从新开始计算可见性;
  5. 若是此记录的DELELE_BIT为false,说明该记录未被删除,能够返回,不然不返回。

RR和RC隔离级别

Repeatable Read和Read Committed隔离级别都是基于read view来实现,不一样之处在于:

  • Repeatable Read

    read view是在执行事务中第一条select语句的瞬间建立,后续全部的select都是复用这个对象,因此能保证每次读取的一致性。(可重复读的语义

  • Read Committed

    事务中每条select语句都会建立read view,这样就能够读取到其它事务已经提交的内容。

对于InnoDB来讲,Repeatable Read虽然比Read Committed隔离级别高,开销反而相对较小。

参考资料

数据库事务与MySQL事务总结

MySQL-InnoDB-MVCC多版本并发控制

MySQL InnoDB MVCC深度分析

乐观锁和 MVCC 的区别?

MySQL 在 RC 隔离级别下是如何实现读不阻塞的?

相关文章
相关标签/搜索