Mysql事务探索及其在Django中的实践（二）

时间 2019-11-08

原文原文链接

　　继上一篇《Mysql事务探索及其在Django中的实践（一）》交代完问题的背景和Mysql事务基础后，这一篇主要想介绍一下事务在Django中的使用以及实际应用给咱们带来的效率提高。sql

　　首先贴上Django官方文档中关于Database Transaction一章的介绍：https://docs.djangoproject.com/en/1.9/topics/db/transactions/。数据库

　　在Django中实现事务主要有两种方式：第一种是基于django ORM框架的事务处理，第二种是基于原生地执行SQL语句的transaction处理。django

基于django ORM框架的事务处理缓存

　　默认状况下，django的事务处理是自动提交（auto-commit），即在执行model.save()，model.delete()时，全部的改动会被当即提交，至关于数据库设置了auto commit，没有任何隐藏的rollback。安全

　　在网上查了一些资料，了解到django手动配置事务的方式主要有三种：第一种是将一个http request的全部数据库操做包裹在一个transaction中，第二种是经过transaction中间件对http请求的事务拦截，第三种是本身在view中经过装饰器灵活控制事务（咱们的平台最后用的就是这一种）。框架

　　1.将一个http request的全部数据库操做包裹在一个transaction中less

　　这种方式配置很是简单，只须要在settings.py中的database配置中加入‘ATOMIC_REQUESTS’: True便可。如图1所示：性能

　　　　　　　　　　　　图1 Database中加入'ATOMIC_REQUESTS'：True优化

　　经过这种配置，django在调每一个view方法以前会开始一个事务，当且仅当该响应没有任何问题，django才会提交这个事务；若是view中出现了异常，则django会回滚该事务。这样作的好处显而易见，就是安全简便，可是随着网站的流量变大，若是每一个view被调用时都打开一个事务就会变得有点繁重，从而会下降网站的效率。它对性能的影响取决于你的应用的查询效率以及你的数据库处理锁的能力。此外，使用这种方式，回退的只是数据库的状态，而不包括其余非数据库项的操做，例如发送email等。网站

　　2.经过transaction中间件对http请求的事务拦截

　　配置方法是在settings.py中配置MIDDLEWARE_CLASSES，如图2所示：

　　　　　　　　　　　　　　　　　　　　　　图2 transaction中间件配置

　　须要注意的是，这样配置以后，与你中间件的配置顺序是有很大关系的。在 TransactionMiddleware 以后的全部中间件都会受到事务的控制。但CacheMiddleware，UpdateCacheMiddleware，FetchFromCacheMiddleware 这些中间件不会受到影响，由于cache机制有本身的处理方式，用了内部的connection来处理。另外TransactionMiddleware 只对默认的数据库配置有效，若是要对另外的数据链接用这种方式，必须本身实现中间件。（此处必须声明，对于这种方法，本人没有仔细研究过，只是借鉴了一下网上的资料）

　　3.本身在view中经过装饰器灵活控制事务

　　最后种方式，经过装饰器灵活配置，也是咱们平台最后采用的方式。

　　　　1）@transaction.autocommit

　　　　django默认的事务处理，采用此装饰模式这种方式能够忽视全局的transaction配置。

　　　　2）@transaction.commit_on_success

　　　　采用此装饰模式，当此方法的全部工做完成后，才会提交事务。

　　　　3）@transaction.commit_manually

　　　　采用这种方式，你能够自由地随意提交或回滚事务，彻底本身处理。若是没有调用commit()或rollback()，则程序会抛出TransactionManagementError异常。

基于原生地执行SQL语句的transaction处理

　　再来说讲Django中第二种事务处理方式，即用原生地执行SQL语句的方式。

　　　　　　　　　　　　　　　　　　　　　　　　图3 原生地执行SQL语句中的事务处理

　　这种处理方式比较简单，以图3中的方法为例，首先定义了一个游标cursor，经过cursor任意地执行sql语句，最后经过transaction.commit_unless_managed()来提交事务。

延伸

　　上面介绍了Django中的两种事务处理的方式，到这里我忽然想到一个问题：

　　若是一个方法中既包含了装饰器@transaction.commit_on_success，又执行了原生SQL语句的事务提交，当方法出现异常致使事务回滚时，原生的SQL语句所提交的事务会不会被回滚？

　　为了验证这个问题，我用Flask写了两个接口来进行验证：

　　接口delete_and_insert和接口delete_and_insert2都是先经过cursor事务提交执行清除表，而后往表里循环插入数据，当知足条件i=480的时候，抛出一个ValueError。惟一的区别就是接口1中采用了装饰器@transaction.commit_on_success，而接口2中没有。实际执行发现：

　　1.在调接口1时，原数据库表中的数据不会变化，说明经过cursor执行清除表的操做也会回滚。

　　2.在调接口2时，原数据库表中的数据被删除，数据库留下的是新的数据：全部的name都为user，而age从1到480。

　　从而证实，当view方法加了装饰器@transaction.commit_on_success后，即便view中使用了cursor执行原生sql语句，并执行了transaction.commit_unless_managed()，可是若是view中有异常抛出，整个view方法的内容都会回滚。　

实际应用

　　最后，回归最初的问题自己，当我把事务应用到咱们平台的后台接口中后，发现了一个意外的惊喜：接口A的执行时间从原来的5-10分钟一会儿缩短到了几秒钟就完成了。欣喜之余仔细思考了一下才以为性能显著提高的缘由应该是：在应用事务以前，全部SQL语句都是自动提交的，每插入一条数据，数据库表的索引可能就须要重建一次，当大量的sql语句逐一插入时，数据库表的索引就须要不断地重建，其中就须要耗费大量的时间。而在应用事务以后，全部的插入是一次性提交，数据库表的索引只须要重建一次，大大减小了开销。

　　这也验证了数据库的索引不是万能的，合理的创建索引确实能大大地优化查询速度，由于索引的存储结构就像一本字典同样，咱们在查找某个特定的字时会根据拼音的首字母的方式先找到该字的第一个字母所在页数，而后直接跳到那一页日后去翻。然而这也决定了字典在初始存储这些字时就须要根据这些字的特色将每一个字放在特定的存储位置。当有新的字加入时，为了插入到特定的位置，就必须从新创建映射关系。

补充：合理创建索引

　　下面是我工做中搜集的一些关于索引创建的规则，也欢迎你们参考，指正：

　　 1.搜索的索引列

　　最适合索引的列是出如今where子句种的列，或链接子句中指定的列。而不是select关键字后的选择列表的列。

　　 2.使用惟一索引

　　索引的列的基数越大，索引效果越好。好比id每行都不一样，出生日期也不太相同，适合做索引。而性别男或女只有二者状况，即便加索引，无论搜索哪一个值都会得出大约一半的行。

　　 3.使用短索引

　　例如对字符串列进行索引，应该制定一个前缀长度。好比一个CHAR(200)的列，若是前10或20个字符内就大不相同，则能够只对前10个或20个字符进行索引。节省大量索引空间，也使查询更快，涉及的磁盘IO较少。较短的键值，索引高速缓存中的块能容纳更多的键值。

　　 4.不要过分索引

　　每一个额外的索引都要占用额外的磁盘空间，下降写操做的性能。由于在写修改表的内容时，索引必须进行更新，有时可能须要重构。就好比一本字典，加入新的字必需要根据目录插入指定位置，后面的内容都要更新。

　　 5. 选择最常做为访问条件的列做为主键

　　InnoDB有一个默认的保存顺序，按照主键或内部列进行访问的速度是最快的（比惟一索引还要快）。