事务处理

引子

最近看一些文章的时候,看到事务的概念,只记得在很早的时候接触过,想不起来有什么用,查询了资料后发现仍是挺有用的。git

介绍

事务处理(Transaction processing)是计算机科学中的信息处理,它被分红单个不可分割的操做,称为事务(transaction)。每一个事务做为一个完整的单元必须成功或者失败,毫不可能部分完成。事务处理经过确保系统上相互依赖的操做,所有成功完成或者所有成功取消,在已知的一致状态上维持系统的完整性。github

举个例子,一个典型的银行交易:将 100 从客户的储蓄帐户转移到客户的支票帐户。这个交易涉及至少 2 个独立的操做:借记储蓄账户 100,记入支票帐户 100。若是一个操做成功,另一个操做失败,银行的帐簿最后会不平衡。这里必需要有一个方式去保证全部操做都成功或都失败,这样在银行的整个数据库中才不会先后矛盾。数据库

在事务中连接了多个操做时,确保全部的操做没有错误的完成,或者都失败。若是其中的一些操做完成但在尝试其它操做时发生了错误,则事务处理系统会“回滚(rolls back)” 事务的全部操做(包括已经成功的操做),从而消除事务的全部痕迹,并将系统恢复处处理事务开始以前所处的一致的已知状态。若是一个事务的全部操做都成功的完成,这个事务会被系统提交(committed),全部对数据库的更改将会是永久性的,一旦事务完成不能被回滚。编程

一般,事务是同时发布的,若是它们重叠,可能会产生冲突。例如一个客户的储蓄帐户上有 150,尝试转帐给另一我的 100,同时转移 100 到支票帐户,那么只有其中的一个能够成功。然而,强制事务按照顺序执行是低效的。所以事务处理的并发编程实现,保证最终结果没有冲突,与任何顺序执行事务时达到的结果相同。在这个例子中,这就意味着无论那个事务先发布,不管是先转帐给另一我的仍是转移到支票帐户成功了,另一个操做就会失败。并发

方法

全部事务处理系统的基本原则都同样。然而,术语可能因事务处理系统而异,下面使用的术语不必定通用。atom

Rollback

事务处理系统经过在修改数据库时,记录数据库的中间状态来确保数据库完整性,而后若是一个事务没法提交,使用这些记录将数据库恢复到已知状态。日志

Rollforward

能够保留对数据库管理系统的全部修改的单独日志。这个对回滚并不须要,但在数据库发生故障时更新数据管理系统颇有用,所以有些事务处理系统提供这个功能。若是数据库管理系统彻底失败,则必须从最近的备份中恢复。备份不会反映自备份以来所提交的事务。可是,一旦数据库管理系统恢复了,就能够将日志应用于数据库(rollforward)以使数据库管理系统保持最新。事务

Deadlock

在一些状况下,两个事务可能在处理的过程当中,同时尝试访问数据库的同一部分,从而阻止它们继续运行。例如,事务 A 访问了数据库的 X ,事务 B 访问了数据库的 Y。若是此时,事务 A 尝试访问数据库的 Y ,事务 B 尝试访问数据库的 X , 则一个死锁(Deadlock)产生了,而且两个事务都不能继续下去。ip

事务处理系统旨在检测这些死锁什么时候发生。一般,两个事务都将被取消并回滚,而后它们将以不一样的顺序自动再次启动,以便再也不发生死锁。或者有些时候,只有其中的一个死锁事务将会被取消和回滚,在短暂的延迟后自动重启。ci

死锁可能涉及 3 个或更多的事务。涉及的事务越多,它们检测的难度就越大,所以事务处理系统能够检测到的死锁,在实际中是有限制的。

Compensating transaction

在提交和回滚机制不可用或不指望的系统中,补偿事务常常用来撤销失败的事务,而且将系统恢复到以前的状态。

ACID 标准

Jim Gray 在 20 世纪 70 年代定义了一个可靠事务系统的特质,缩写为 ACID —— atomicity(原子性)、consistency(一致性)、 isolation(独立性)、durability(耐久性) 。

Atomicity

事务对状态的改变是原子的:要么所有发生,要么都不发生。

Consistency

一个事务是状态的一种正确转换。做为一组采起的行为不违反跟状态相关的任何完整性的约束。

Isolation

即便事务并发执行,对于每一个事务 T ,其余事务看起来在 T 以前或 T 以后执行,但不是二者同时执行。

Durability

一旦事务成功完成(提交),它对数据库的更改,将在数据库失败后继续存在并保留其更改。

优势

事务处理有下面的优势:

  • 它容许用户之间共享计算机资源
  • 它将做业处理的时间合理转换
  • 它避免了在没有人工交互和监督的状况下闲置计算资源
  • 它被用在昂贵的计算机上,经过保持对这些昂贵资源的高利用率来帮助分摊成本

缺点

事务处理有下面的缺点:

  • 它们具备相对昂贵的设置成本
  • 缺少标准的格式
  • 硬件和软件不兼容

参考资料

相关文章
相关标签/搜索