Mysql技术内幕——InnoDB存储引擎

一.mysql体系结构和存储引擎mysql

1.一、数据库和实例的区别算法


数据库:物理操做系统或其余形式文件类型的集合。在mysql下数据库文件能够是frm,myd,myi,ibd结尾的文件。sql

         数据库实例:由数据库后台进程/线程以及一个共享内存区组成。数据库实例才是真正用来操做数据库文件的。数据库

         mysql数据库是单进程多线程的程序,与sql server比较相似。也就是说,Mysql数据库实例在系统上的表现就是一个进程。缓存

1.二、mysql的体系结构安全

5202e5f2b21193136942a6fc67380cd791238d3e


mysql由链接池组件、管理服务和工具组件、sql接口组建、查询分析器组件、优化器组件、缓存组件、插件是存储引擎、物理文件。服务器

1.三、mysql存储引擎网络

      1.3.一、innodb存储引擎,特色支持外键、行锁、非锁定读(默认状况下读取不会产生锁)、mysql-4.1开始支持每一个innodb引擎的表单独放到一个表空间里。innodb经过使用MVCC来获取高并发性,而且实现sql标准的4种隔离级别,同时使用一种被称成next-key locking的策略来避免换读(phantom)现象。除此以外innodb引擎还提供了插入缓存(insert buffer)、二次写(double write)、自适应哈西索引(adaptive hash index)、预读(read ahead)等高性能技术。session

      1.3.二、myisam存储引擎,myisam特色是不支持事物,适合olap应用,myisam表由MYD和MYI组成。mysql-5.0版本以前,myisam默认支持的表大小为4G,从mysql-5.0之后,myisam默认支持256T的表单数据。myisam只缓存索引数据。数据结构

      1.3.三、NDB存储引擎,特色是数据放在内存中,mysql-5.1版本开始能够将非索引数据放到磁盘上。NDB以前的缺陷是join查询是mysql数据库层完成的,而不是存储引擎完成的,复杂的join查询须要巨大的网络开销,速度很慢。当前mysql cluster7.2版本中已经解决此问题,join查询效率提升了70倍。

      1.3.四、memeory存储引擎,将数据放到内存中,默认使用hash索引,不支持text和blob类型,varchara是按照char的方式来存储的。mysql数据库使用memory存储引擎做为临时表还存储中间结果集(intermediate result),若是中间集结果大于memorg表的容量设置,又或者中间结果集包含text和blog列类型字段,则mysql会把他们转换到myisam存储引擎表而放到磁盘上,会对查询产生性能影响。

      1.3.五、archive存储引擎,压缩能力较强,主要用于归档存储。

      1.3.六、federated存储引擎,不存储数据,他指向一台远程mysql数据库上的表。

      1.3.七、maria存储引擎,myisam的后续版本,支持缓存数据和索引,行锁设计,支持mvcc,支持事务和非事务安全的选项,以及更好的BLOG字符类型的处理性能。

      1.3.八、其余存储引擎,sphinx用于全文索引,infobright用于数据仓库。

1.4链接Mysql

1.4.一、TCP/IP:基于网络的链接,链接进行权限检查。

         1.4.二、命名管道和共享内存:Windows系统上同一服务器上的两进程可经过命名管道链接,需在配置文件中启用--enable-named-pipe选项。

         1.4.三、Unix套接字:客户端与服务端位于同一服务器时才可以使用,能够在my.cnf中指定-socket=/tmp/mysql.sock,链接时指定./mysql -S/tmp/mysql.sock。

二.InnoDB存储引擎

2.二、innodb引擎架构

       InnoDB的多个内存块组成了内存池,负责以下工做:

1).维护全部进程/线程须要访问的多个内部数据结构。

      2).缓存磁盘上的数据,方便快速的读取,而且在对磁盘文件的数据进行修改以前在这里缓存。

      3).重作日志缓存。

      后台线程的主要做用是负责刷新内存池中的数据,保证缓冲池中的内存缓存是最近的数据,此外、将已经修改的数据文件刷新到磁盘文件

      2.2.一、后台线程

      innodb存储引擎后台有7个线程,—–4个IO线程(insert buffer thread,log thread,read thread,write thread),1个master thread,一个lock监控线程,一个错误监控线程。

      2.2.二、内存

      innodb存储引擎内存由如下三个部分组成:缓冲池(buffer pool),重作日志缓存(redo log buffer),额外的内存池(additional memory pool)。可使用 show engine innodb status来查看innodb_buffer_pool的使用状况。

      innodb_buffer_pool_size:具体看,缓冲池中的数据库类型有:索引页、数据库页、undo页、插入缓存页(insert buffer)、自适应hash(adaptive hashindex)、innodb存储的锁信息(lock info)、数据字典信息(data dictionary)。

         InnoDB工做方式:将数据文件按页(每页16K)读入InnoDBbuffer pool,而后按最近最少使用算法(LRU)保留缓存数据,最后经过必定频率将脏页刷新到文件。


faacb564034f78f09d3ac3bf7b310a55b3191c0d

2.三、master thread

      2.3.一、master thread源码分析

91138622720e0cf3638d17b70846f21fbf09aac1


      2.3.二、master thread的潜在问题

      一、因为硬件的发展,如今的硬件性能已经提升了不少,若是innodb每秒最大刷新100个脏页,那么效率会很低,为了解决这个问题,innodb plugin提供了一个参数innodb_io_capacity,用来表示磁盘IO的吞吐量,默认值是200,规则以下:在合并插入缓存时,合并插入缓存的数量为innodb_io_capacity的5%;在从缓冲区刷新脏页时,啥新脏页的数量为innodb_io_capacity。

      二、关于innodb_max_dirty_pages_pct值的争议,若是值过大,内存也很大或者服务器压力很大,那么效率很下降,若是设置的值太小,那么硬盘的压力会增长,建议是在75-80.而且innodb plugin引进了innodb_adaptive_flushng(自适应的刷新),该值影响每秒刷新脏页的数量。

2.四、关键特性,为innodb提升性能的技术

      2.4.一、插入缓存

      当一个表有非汇集索引时,对于非汇集索引的叶子节点的插入不是顺序的,这时候须要离散的访问非汇集索引页,性能就在这里下降了,这是因为b+树的原理致使的。插入缓存就是用来解决这个问题的。

      对于非汇集索引的插入和更新操做,不是每一次都直接插入索引页,而是先判断插入的非汇集索引页是否在缓存中,若是在就直接插入,若是不在就放入到一个插入缓冲区中,好似欺骗数据库这个非汇集索引已经插入到叶子节点了。而后再以必定的频率插入缓存和非汇集索引页字节点的合并操做。

      插入缓存的使用须要知足如下两个条件(也就是非惟一的辅助索引):索引是辅助索引;索引不是惟一的。

      2.4.二、两次写

      两次写给innodb带来的是可靠性,主要用来解决部分写失败(partial page write)。在应用重作日以前,咱们须要一个页的副本,当写入失效发生时,先经过页的副原本还原该页,再进行重作,这就是doublewrite。

      doublewrite有两部分组成,一部分是内存中的doublewrite buffer,大小为2M,另一部分就是物理磁盘上的共享表空间中联系的128个页,即两个区,大小一样为2M。当缓冲池的张也刷新时,并不直接写硬盘,而是回经过memcpy函数将脏页先拷贝到内存中的doublewrite buffer,以后经过doublewrite buffer再分两次写,每次写入1M到共享表空间的物理磁盘上,而后立刻调用fsync函数,同步磁盘。

      2.4.三、自适应哈西索引

      因为innodb不支持hash索引,可是在某些状况下hash索引的效率很高,因而出现了 adaptive hash index功能,innodb存储引擎会监控对表上索引的查找,若是观察到创建hash索引能够提升性能的时候,则自动创建hash索引。

2.五、启动、关闭、恢复

innodb_fast_shutdown影响InnoDB表关闭。该参数有0、一、2三个参数。

      0 MySQL关闭时  完成全部的full purge和merge insertbuffer操做

         1默认值 只将缓冲池内的一些脏页刷新至磁盘

         2将日志都写入日志文件不会有任何事务丢失但下次启动时会进行recovery

      innodb_force_recovery影响整个innodb存储引擎的恢复情况,该值默认为0,表示当须要恢复时,须要执行全部的恢复操做,当不能进行有效恢复时,如数据页发生了corruption,mysql数据库可能宕机,并把错误写入错误日志中。

三.文件

3.1参数文件

      Mysql实例能够不须要参数文件,这是全部的参数值取决于编译Mysql时指定的默认值和源代码中指定参数的默认值。其参数文件是Mysql.cnf。

3.1.一、什么是参数

      参数是一个键/值对。可使用show variables like命令查看,也能够经过information_schema的GLOBAL_VARIABLES视图来查找。

3.1.二、参数类型

      参数文件分为两类:动态参数和静态参数。动态参数意味着你能够在Mysql实例运行中进行更改;静态参数说明在整个实例生命周期内都不得进行更改,好像是只读的。对于动态参数,又能够分为global和session关键字,代表该参数的修改是基于当前会话仍是真格实例的生命周期。有些动态参数只能在会话中进行修改,如autocommit;有些参数修改完后,在整个实例生命周期中都会生效,如binlog_cache_size;而有些参数既能够在会话又能够在整个实例的生命周期内生效,如read_buffer_size。

3.二、日志文件

3.2.一、错误日志

      错误日志对Mysql的启动、运行、关闭过程进行了记录。出现Mysql不能正常启动时,第一个必须查找的文件应该就是错误日志文件。使用show variables like ‘log_error’来定位文件。

3.2.二、慢查询日志

      慢查询能为SQL语句的优化带来很好的帮助。设定一个阀值,将运行时间超过该值的全部SQL语句都记录到慢查询日志文件中。用参数long_query_time来设置。另外一个参数log_queries_not_using_indexes,若运行的SQL语句没有使用索引,则这条SQL语句会被记录下来。

3.2.三、查询日志

      查询日志记录了全部对Mysql请求的信息,不论这些请求是否获得正确的执行。默认文件名为:主机名.log。

3.2.四、二进制日志

      二进制记录了对数据库执行更改的全部操做,可是不包括SELECT和SHOW操做,还包括了执行时间和更改操做时间。可用来恢复某些数据,同时也能够用来复制同步远程数据库。将binlog_format设置成row,能够支持事务隔离级别为READ COMMITTED,以得到更好的并发性。在使用MIXED格式下,mysql采用STATEMENT格式进行二进制日志文件的记录,可是有一些状况下会使用ROW格式,可能的状况以下:

一、表的存储引擎为NDB,这个时候DML操做都会以ROW格式记录。

二、使用了uuid()、user(),current_user(),found_rows(),row_count(),等不肯定函数。

三、使用了insert delay语句

四、使用了用户定于的函数(UDF)

五、使用了临时表(temporary table)

注意:针对系统库mysql里面的表发生变化的处理规则以下:

一、 若是采用insert,update,delete直接操做表,则日志根据binlog_format设定的格式记录。

二、 若是使用grant,revoke,set password等DCL语句,那么不管如何都会使用SBR模式记录。

三、 blockhole引擎不支持row格式,ndb引擎不支持statement格式。

3.三、套件字文件

 Unix系统下本地链接Mysql能够采用Unix套接字方法,须要一个套接字文件,可使用show variableslike ‘socket’查询。

3.四、pid文件和表结构定义文件

         pid文件是实例启动是记录本身进程ID号的文件,表结构定义文件是以frm为后缀名的文件,还能够用来存放视图的定义。

3.五、innodb引擎文件

3.5.一、表空间文件

         默认表空间文件为ibdata1文件innodb_data_file_path存储数据,innodb_file_per_table能够按表分别产生一个表空间.db文件,但仅存该表的数据索引和插入缓冲等信息,其余信息如undo信息,系统事务信息,double write buffer等仍是存放在默认表空间(ibdata1或表空间组)里。

3.5.二、重作日志文件

      redo log是在实例或者介质失败的时候,用来保证数据完整性。每一个innodb存储引擎至少有一个重作日志组,每一个重作日志文件组下至少又2个重作日志文件,如默认的ib_logfile0、ib_logfile1.为了获得更高的可靠性,你能够设置多个重作镜像日志组。

      由于重作日志条目先被写到日志缓冲中,而后根据必定条件刷新到磁盘重作日志文件中。与redo log相关的就是innodb_flush_log_at_trx_commit的值,对innodb的性能影响很大。他有0,1,2三个值,0表明提交事务时,并不一样步写redo log,而是等master threas每秒写。1表明commit的时候就将redo log缓存写入磁盘,2表明commit的时候将redo log缓存异步的写入磁盘。

相关文章
相关标签/搜索