mysql的"双1设置"-数据安全的关键参数（案例分享）

时间 2019-12-07

标签 mysql 设置数据安全关键参数案例分享栏目 MySQL 繁體版

原文原文链接

mysql的"双1验证"指的是innodb_flush_log_at_trx_commit和sync_binlog两个参数设置，这两个是是控制MySQL 磁盘写入策略以及数据安全性的关键参数。下面从参数含义，性能，安全角度阐述两个参数为不一样的值时对db 性能,数据的影响。mysql

1、参数意义ios

innodb_flush_log_at_trx_commit
若是innodb_flush_log_at_trx_commit设置为0：log buffer将每秒一次地写入log file中，而且log file的flush(刷到磁盘)操做同时进行.该模式下，在事务提交的时候，不会主动触发写入磁盘的操做;
若是innodb_flush_log_at_trx_commit设置为1：每次事务提交时MySQL都会把log buffer的数据写入log file，而且flush(刷到磁盘)中去;
若是innodb_flush_log_at_trx_commit设置为2：每次事务提交时MySQL都会把log buffer的数据写入log file，可是flush(刷到磁盘)操做并不会同时进行。该模式下,MySQL会每秒执行一次 flush(刷到磁盘)操做。sql

注意：因为进程调度策略问题,这个"每秒执行一次 flush(刷到磁盘)操做"并非保证100%的"每秒"。数据库

sync_binlog
sync_binlog 的默认值是0，像操做系统刷其余文件的机制同样，MySQL不会同步到磁盘中去而是依赖操做系统来刷新binary log。
当sync_binlog =N (N>0) ，MySQL 在每写 N次二进制日志binary log时，会使用fdatasync()函数将它的写二进制日志binary log同步到磁盘中去。缓存

注意：若是启用了autocommit，那么每个语句statement就会有一次写操做；不然每一个事务对应一个写操做。安全

2、性能服务器

两个参数在不一样值时对db的纯写入的影响表现以下：
测试场景1
innodb_flush_log_at_trx_commit=2
sync_binlog=1000app

测试场景2
innodb_flush_log_at_trx_commit=1
sync_binlog=1000async

测试场景3
innodb_flush_log_at_trx_commit=1
sync_binlog=1函数

测试场景4
innodb_flush_log_at_trx_commit=1
sync_binlog=1000

测试场景5
innodb_flush_log_at_trx_commit=2
sync_binlog=1000

在以上5个场景下的TPS分别为:
场景1 41000
场景2 33000
场景3 26000
场景4 33000

因而可知，当两个参数设置为双1的时候，写入性能最差，sync_binlog=N (N>1 ) innodb_flush_log_at_trx_commit=2 时，(在当前模式下)MySQL的写操做才能达到最高性能。

3、安全

当innodb_flush_log_at_trx_commit和sync_binlog 都为 1 时是最安全的，在mysqld 服务崩溃或者服务器主机crash的状况下，binary log 只有可能丢失最多一个语句或者一个事务。可是鱼与熊掌不可兼得，双11 会致使频繁的io操做，所以该模式也是最慢的一种方式。
当innodb_flush_log_at_trx_commit设置为0，mysqld进程的崩溃会致使上一秒钟全部事务数据的丢失。
当innodb_flush_log_at_trx_commit设置为2，只有在操做系统崩溃或者系统掉电的状况下，上一秒钟全部事务数据才可能丢失。

"双1设置"适合数据安全性要求很是高，并且磁盘IO写能力足够支持业务，好比订单,交易,充值,支付消费系统。双1模式下，当磁盘IO没法知足业务需求时好比11.11 活动的压力。推荐的作法是 innodb_flush_log_at_trx_commit=2 ，sync_binlog=N (N为500 或1000) 且使用带蓄电池后备电源的缓存cache，防止系统断电异常。

4、小结

系统性能和数据安全是业务系统高可用稳定的必要因素。咱们在对系统的优化须要寻找一个平衡点，合适的才是最好的，根据不一样的业务场景需求，能够将两个参数作组合调整，以即是db系统的性能达到最优化。

案例分享1：一条insert语句的执行，耗时40ms缘由剖析

背景：一个简单的带有主键的insert语句，执行起来竟然要耗时40ms ，实在是难以忍受！排查分析过程以下：

所以须要关注的是数据从插入落地的IO中间都干了什么？

1、MySQL的文件
首先简单介绍一下MySQL的数据文件，MySQL 数据库包含以下几种文件类型：
1）数据文件 (datafile)
存放表中的具体数据的文件。
2）数据字典
记录数据库中全部innodb表的信息。
3）重作日志 (redolog)
记录数据库变动记录的文件，用于系统异常crash(掉电)后的恢复操做，能够配置多个(配置这个参数inodb_log_files_in_group)好比 ib_logfile0、 ib_logfile1。
4）回滚日志 (undolog)
也存在于mysql 的ibdata文件，用户记录事务的回滚操做。注在mysql5.6以上版本能够拆开出来，单独文件夹存在。
5）归档日志 (binlog)
事务提交以后，记录到归档日志中。
6）中继日志 (relaylog)
从master获取到slave的中转日志文件，sql_thread则会应用relay log并重放于从机器。
7）其余日志slowlolg, errorlog, querylog
这里慢日志也常常用。能够结合pt-query-digest工具和anemometer一块儿展现出来。
对于以上文件的IO访问顺序能够分为顺序访问好比binlog ，redolog ，relay log是顺序读写，datafile，ibdata file是随机读写，这些IO访问的特色决定了在os 配置磁盘信息时候，如何考虑分区，好比顺序写能够的log能够放到SAS盘，随机读写的数据文件能够放到ssd或者fio高性能的存储。

2、写操做
为了保证数据写入操做的安全性，数据库系统设置了 undo，redo 保护机制，避免由于os或者数据库系统异常致使的数据丢失或者不一致的异常状况发生。

1）先写undo log。
2）在内存更新数据，这步操做就在内存中造成了脏页，若是脏页过多，checkpoint机制进行刷新，innodb_max_dirty_pages_pct决定了刷新脏页比例。innodb_io_capacity参数能够动态调整刷新脏页的数量，innodb_lru_scan_depth这个参数决定了刷新每一个innodb_buffer_pool的脏页数量。
3）记录变动到redo log，prepare这里会写事务id。innodb_flush_log_at_trx_commit决定了事务的刷盘方式。为0时，log buffer将每秒一次地写入log file中，而且log file的flush(刷到磁盘)操做同时进行。该模式下，在事务提交的时候，不会主动触发写入磁盘的操做。为1，每次事务提交时MySQL都会把log buffer的数据写入log file，而且flush(刷到磁盘)中去.为2，每次事务提交时MySQL都会把log buffer的数据写入log file.可是flush(刷到磁盘)操做并不会同时进行。该模式下，MySQL会每秒执行一次 flush(刷到磁盘)操做。
4）写入binlog这里会写入一个事务id这里有个sync_binlog参数决定多个事务进行一次性提交。
5）redo log第二阶段，这里会进行判断前2步是否成功，成功则默认commit，不然rollback。刷入磁盘操做。这里是先从脏页数据刷入到内存2M大小的doublewrite buffer，而后是一次性从内存的doublewrite buffer刷新到共享表空间的doublewrite buffer，这里产生了一次IO。而后从内存的内存的doublewrite buffer刷新2m数据到磁盘的ibd文件中，这里须要发生128次io。而后校验，若是不一致，就由共享表空间的副本进行修复。这里有个参数innodb_flush_method决定了数据刷新直接刷新到磁盘，绕过os cache。
6）返回给client。
若是有slave，第4步以后通过slave服务线程io_thread写到从库的relay log ，再由sql thread应用relay log到从库中。

3、关于性能
写undo redo log ，binlog的过程当中都是顺序写，都会很快的完成，随机写操做，inset_buffer功能。
对于非汇集类索引的插入和更新操做(5.5 版本及以上支持Update/Delete/Purge等操做的buffer功能)，不是每一次都直接插入到索引页中，而是先插入到内存中。具体作法是：若是该索引页在缓冲池中，直接插入；不然，先将其放入插入缓冲区中，再以必定的频率和索引页合并，就能够将同一个索引页中的多个插入合并到一个IO操做中，改随机写为顺序写，大大提升写性能。

关于数据安全，这是数据库写入的重点？
1，2，3过程失败就是事务失败，由于此时还未写入磁盘，对磁盘中的数据无影响，返回事务失败给client，从库也不会受到影响。 4，5过程失败的时候或者已经将写成功返回给客户，能够根据redo log的记录来进行恢复，若是出现部分写失效请参考《double write》。
MySQL的写redo log的第一个阶段会把全部须要作的操做作完，记录数据变动，第二阶段的工做比较简单，只作事务提交确认。若是写入binlog成功，而第二阶段失败，MySQL启动时也会将事务进行重作，最终更新到磁盘中。MySQL 5.5+的smei sync能够更好的保障主从的事务一致性。

4、文件访问方式
IO 访问的方式分为两种顺序读写和随机读写，在MySQL的io过程当中能够以此来将数据库文件分类。
顺序读写：重作日志ib_logfile*，binlog file。
随机读写：innodb表数据文件，ibdata文件。
根据系统的访问类型，对硬件作以下分类：读多（SSD+RAID）、写多FIO(flashcache)、容量密集（fio + flashcache）。
因为随机io会严重下降系统的性能，在当前的硬件水平下，能够考虑选择奖数据库服务器配置ssd/fusionio。

5、影响IO的参数和策略
影响mysql io的参数有不少个，这里罗列几个重要的参数。
innodb_buffer_pool_size
该参数控制innodb缓存大小，用于缓存应用访问的数据，推荐配置为系统可用内存的80%。
binlog_cache_size
该参数控制二进制日志缓冲大小，当事务尚未提交时，事务日志存放于cache，当遇到大事务cache不够用的时，mysql会把uncommitted的部分写入临时文件,等到committed的时候才会写入正式的持久化日志文件。
innodb_max_dirty_pages_pct
该参数能够直接控制Dirty Page在BP中所占的比率，当dirty page达到了该参数的阈值，就会触发MySQL系统刷新数据到磁盘。
innodb_flush_log_at_trx_commit
该参数肯定日志文件什么时候write、flush。
为0，log buffer将每秒一次地写入log file中，而且log file的flush(刷到磁盘)操做同时进行.该模式下，在事务提交的时候，不会主动触发写入磁盘的操做。
为1，每次事务提交时MySQL都会把log buffer的数据写入log file，而且flush(刷到磁盘)中去.
为2，每次事务提交时MySQL都会把log buffer的数据写入log file.可是flush(刷到磁盘)操做并不会同时进行。该模式下,MySQL会每秒执行一次 flush(刷到磁盘)操做。
注意：因为进程调度策略问题，这个“每秒执行一次flush(刷到磁盘)操做”并非保证100%的“每秒”。
sync_binlog
sync_binlog的默认值是0，像操做系统刷其余文件的机制同样，MySQL不会同步到磁盘中去而是依赖操做系统来刷新binary log。
当sync_binlog =N (N>0) ，MySQL 在每写 N次二进制日志binary log时，会使用fdatasync()函数将它的写二进制日志binary log同步到磁盘中去。
innodb_flush_method
该参数控制日志或数据文件如何write、flush。可选的值为fsync，o_dsync，o_direct，littlesync，nosync。
数据库的I/O是一个很复杂和细致的知识层面，涉及数据库层和OS层面的IO写入策略，也和硬件的配置有关。

案例分享2: 同一条sql语句，有时插入块，有时插入慢缘由剖析

背景：同一条sql ，有时插入时间几毫秒，有时插入时间倒是几十毫秒！为何呢？分析过程以下：

Sql角度：简单insert

表角度: 一个主键

系统参数角度：
开启了双1 策略。
也就意味着每次事物就会有刷新磁盘
关闭双1 ，设置为 0 100 ，或者 2 100 ，会极大提高性能。这是由于不刷硬盘了，但不能解决为何时快时慢问题。

操做系统角度
使用"iostat -xmd 1"命令看磁盘使用状况

以上看出磁盘明显不够快，读写0.15M就使用了7%

上面能够看出，来个顺序文件拷贝操做，30M使用就使用了100%，离散读写更慢了！

使用"sar -B 1"命令能够查看页面交换

pgpgin/s: 表示每秒从磁盘或SWAP置换到内存的字节数(KB)
pgpgout/s: 表示每秒从内存置换到磁盘或SWAP的字节数(KB)
fault/s: 每秒钟系统产生的缺页数,即主缺页与次缺页之和(major + minor)
majflt/s: 每秒钟产生的主缺页数.
pgfree/s: 每秒被放入空闲队列中的页个数
pgscank/s: 每秒被kswapd扫描的页个数
pgscand/s: 每秒直接被扫描的页个数
pgsteal/s: 每秒钟从cache中被清除来知足内存须要的页个数
%vmeff: 每秒清除的页(pgsteal)占总扫描页(pgscank+pgscand)的百分比

以上表示内存和swap进行了频繁的数据交换！

那个进程在使用swap呢？

下面截图中命令是for i in $(ls /proc | grep "^[0-9]" | awk '$0>100'); do awk '/Swap:/{a=a+$2}END{print '"$i"',a/1024"M"}' /proc/$i/smaps;done| sort -k2nr | head

在通过几个小时后，mysql 使用swap由88M变成了104M ，这说明一直在使用和增长的。

问题基本定位
1）首先是磁盘性能不高，顺序写才30M ,离散写会下降10倍
2）其次是mysql又使用了swap 空间，这就使得性能更差
3） Mysql 开启了双1 验证，就会等待数据刷磁盘，

磁盘使用频率不稳定，致使了mysql的插入时间会时快时慢

如何解决？
1）减小mysql使用swap方式。即把swapness设置为1。
即执行"sysctl vm.swappiness=1",而且在/etc/sysctl.conf文件中也要设置为1；
2）下降内存，好比设置innodb_buffer_pool_size =4G，原来设置的是6G ,这样能够节约一部份内存空间；
3）开启innodb_numa_interleave = ON 来操做numa；
4）更换SSD 或者不用开启双1，改为 2 100

只调整操做系统参数，不更换硬件，依然开启双一，重启mysql以后呢？

能够看到mysql已经再也不使用swap空间了。可是由于双一参数的使用，每次事物都会刷磁盘，而这个机械磁盘的性能在随机读写的状况下不稳定。会依然存在时快时慢的问题。