MySQLServer系统架构

逻辑模块组成 
总的来讲,MySQL能够当作是二层架构。
第一层咱们一般叫作SQL Layer (SQL层),在MySQL数据库系统处理底层数据以前的全部工做都是在这一层完成的,包括权限判断,sql解析,执行计划优化,querycache的处理等等;

第二层就是存储引擎层,咱们一般叫作Storage Engine Layer(存储引擎层),也就是底层数据存取操做实现部分,由多种存储引擎共同组成。
因此,能够用以下一张最简单的架构示意图来表示MySQL的基本架构,如图2-1所示:

虽然从上图看起来MySQL架构很是的简单,就是简单的两部分而已,但实际上每一层中都含有各自的不少小模块,尤为是第一层SQLLayer,结构至关复杂的。下面咱们就分别针对SQL Layer和Storage Engine Layer作一个简单的分析。 

SQ LLayer中包含了多个子模块,下面我将逐个作一下简单的介绍:
一、初始化模块 顾名思议,初始化模块就是在MySQL Server启动的时候,对整个系统作各类各样的初始化操做,好比各类buffer,cache结构的初始化和内存空间的申请,各类系统变量的初始化设定,各类存储引擎的初始化设置,等等。 

二、核心API 核心API模块主要是为了提供一些须要很是高效的底层操做功能的优化实现,包括各类底层数据结构的实现,特殊算法的实现,字符串处理,数字处理等,小文件I/O,格式化输出,以及最重要的内存管理部分。核心API模块的全部源代码都集中在mysys和strings文件夹下面,有兴趣的读者能够研究研究。 

三、网络交互模块 底层网络交互模块抽象出底层网络交互所使用的接口api,实现底层网络数据的接收与发送,以方便其余各个模块调用,以及对这一部分的维护。全部源码都在vio文件夹下面。

四、Client&Server交互协议模块任何C/S结构的软件系统,都确定会有本身独有的信息交互协议,MySQL也不例外。MySQL的Client&Server交互协议模块部分,实现了客户端与MySQL交互过程当中的全部协议。固然这些协议都是创建在现有的OS和网络协议之上的,如TCP/IP以及Unix Socket。

五、用户模块 用户模块所实现的功能,主要包括用户的登陆链接权限控制和用户的受权管理。他就像MySQL的大门守卫同样,决定是否给来访者“开门”。

六、访问控制模块 造访客人进门了就能够想干吗就干吗么?为了安全考虑,确定不能如此随意。这时候就须要访问控制模块实时监控客人的每个动做,给不一样的客人以不一样的权限。访问控制模块实现的功能就是根据用户模块中各用户的受权信息,以及数据库自身特有的各类约束,来控制用户对数据的访问。用户模块和访问控制模块二者结合起来,组成了MySQL整个数据库系统的权限安全管理的功能。 

七、链接管理、链接线程和线程管理 链接管理模块负责监听对MySQLServer的各类请求,接收链接请求,转发全部链接请求到线程管理模块。每个链接上MySQLServer的客户端请求都会被分配(或建立)一个链接线程为其单独服务。而链接线程的主要工做就是负责MySQLServer与客户端的通讯,接受客户端的命令请求,传递Server端的结果信息等。线程管理模块则负责管理维护这些链接线程。包括线程的建立,线程的cache等。 

八、Query解析和转发模块 在MySQL中咱们习惯将全部Client端发送给Server端的命令都称为query,在MySQLServer里面,链接线程接收到客户端的一个Query后,会直接将该query传递给专门负责将各类Query进行分类而后转发给各个对应的处理模块,这个模块就是query解析和转发模块。其主要工做就是将query语句进行语义和语法的分析,而后按照不一样的操做类型进行分类,而后作出针对性的转发。

九、QueryCache模块 QueryCache模块在MySQL中是一个很是重要的模块,他的主要功能是将客户端提交给MySQL的Select类query请求的返回结果集cache到内存中,与该query的一个hash值作一个对应。该Query所取数据的基表发生任何数据的变化以后,MySQL会自动使该query的Cache失效。在读写比例很是高的应用系统中,QueryCache对性能的提升是很是显著的。固然它对内存的消耗也是很是大的。 

十、Query优化器模块 Query优化器,顾名思义,就是优化客户端请求的query,根据客户端请求的query语句,和数据库中的一些统计信息,在一系列算法的基础上进行分析,得出一个最优的策略,告诉后面的程序如何取得这个query语句的结果。 

十一、表变动管理模块 表变动管理模块主要是负责完成一些DML和DDL的query,如:update,delte,insert,createtable,altertable等语句的处理。 

十二、表维护模块 表的状态检查,错误修复,以及优化和分析等工做都是表维护模块须要作的事情。

1三、系统状态管理模块 系统状态管理模块负责在客户端请求系统状态的时候,将各类状态数据返回给用户,像DBA经常使用的各类showstatus命令,show variables 命令等,所获得的结果都是由这个模块返回的。

1四、表管理器 这个模块从名字上看来很容易和上面的表变动和表维护模块相混淆,可是其功能与变动及维护模块却彻底不一样。你们知道,每个MySQL的表都有一个表的定义文件,也就是*.frm文件。表管理器的工做主要就是维护这些文件,以及一个cache,该cache中的主要内容是各个表的结构信息。此外它还维护table级别的锁管理。 

1五、日志记录模块 日志记录模块主要负责整个系统级别的逻辑层的日志的记录,包括errorlog,binarylog,slowquerylog等。 

1六、复制模块 复制模块又可分为Master模块和Slave模块两部分,Master模块主要负责在Replication环境中读取Master端的binary日志,以及与Slave端的I/O线程交互等工做。Slave模块比Master模块所要作的事情稍多一些,在系统中主要体如今两个线程上面。一个是负责从Master请求和接受binary日志,并写入本地relaylog中的I/O线程。另一个是负责从relaylog中读取相关日志事件,而后解析成能够在Slave端正确执行并获得和Master端彻底相同的结果的命令并再交给Slave执行的SQL线程。 

1七、存储引擎接口模块 存储引擎接口模块能够说是MySQL数据库中最有特点的一点了。目前各类数据库产品中,基本上只有MySQL能够实现其底层数据存储引擎的插件式管理。这个模块实际上只是一个抽象类,但正是由于它成功地将各类数据处理高度抽象化,才成就了今天MySQL可插拔存储引擎的特点。


各模块工做配合 

在了解了MySQL的各个模块以后,咱们再看看MySQL各个模块间是如何相互协同工做的。
接下来,咱们经过启动MySQL,客户端链接,请求 query,获得返回结果,最后退出,这样一整个过程来进行分析。 

启动阶段:
当咱们执行启动 MySQL 命令以后,MySQL的初始化模块就从系统配置文件中读取系统参数和命令行参数,并按照参数来初始化整个系统,如申请并分配buffer,初始化全局变量,以及各类结构等。同时各个存储引擎也被启动,并进行各自的初始化工做。当整个系统初始化结束后,由链接管理模块接手。链接管理模块会启动处理客户端链接请求的监听程序,包括tcp/ip的网络监听,还有unix的socket。这时候,MySQL Server就基本启动完成,准备好接受客户端请求了。 

链接:
当链接管理模块监听到客户端的链接请求(借助网络交互模块的相关功能),双方经过Client&Server交互协议模块所定义的协议“寒暄”几句以后,链接管理模块就会将链接请求转发给线程管理模块,去请求一个链接线程。 

线程处理:
线程管理模块立刻又会将控制交给链接线程模块,告诉链接线程模块:如今我这边有连 接请求过来了,须要创建链接,你赶快处理一下。链接线程模块在接到链接请求后,首先会检查当前链接线程池中是否有被cache的空闲链接线程,若是有,就取出一个和客户端请求链接上,若是没有空闲的链接线程,则创建一个新的链接线程与客户端请求链接。
固然,链接线程模块并非在收到链接请求后立刻就会取出一个链接线程连和客户端链接,而是首先经过调用用户模块进行受权检查,只有客户端请求经过了受权检查后,他才会将客户端请求和负责请求的链接线程连上。 

在MySQL中,将客户端请求分为了两种类型:
一种是query,须要调用 Parser (解析器) 也就是Query解析和转发模块的解析才可以执行的请求;
一种是command,不须要调用Parser就能够直接执行的请求。
若是咱们的初始化配置中打开了FullQueryLogging的功能,那么Query解析与转发模块会调用日志记录模块将请求计入日志,无论是一个Query类型的请求仍是一个command类型的请求,都会被记录进入日志,因此出于性能考虑,通常不多打开FullQueryLogging的功能。

 当客户端请求和链接线程“互换暗号(互通协议)”接上头以后,链接线程就开始处理客户端请求发送过来的各类命令(或者query),接受相关请求。它将收到的query语句转给Query解析和转发模块,Query解析器先对Query进行基本的语义和语法解析,而后根据命令类型的不一样,有些会直接处理,有些会分发给其余模块来处理。 

若是是一个Query类型的请求,会将控制权交给Query解析器。Query解析器首先分析看是否是一个select类型的query,若是是,则调用查询缓存模块,让它检查该query在querycache中是否已经存在。若是有,则直接将cache中的数据返回给链接线程模块,而后经过与客户端的链接的线程将数据传输给客户端。若是不是一个能够被cache的query类型,或者cache中没有该query的数据,那么query将被继续传回query解析器,让query解析器进行相应处理,再经过query分发器分发给相关处理模块。

若是解析器解析结果是一条未被cache的select语句,则将控制权交给Optimizer,也就是Query优化器模块,若是是DML或者是DDL语句,则会交给表变动管理模块,若是是一些更新统计信息、检测、修复和整理类的query则会交给表维护模块去处理,复制相关的query则转交给复制模块去进行相应的处理,请求状态的query则转交给了状态收集报告模块。实际上表变动管理模块根据所对应的处理请求的不一样,是分别由insert处理器、delete处理器、update处理器、create处理器,以及alter处理器这些小模块来负责不一样的DML和DDL的。

在各个模块收到Query解析与分发模块分发过来的请求后,首先会经过访问控制模块检查链接用户是否有访问目标表以及目标字段的权限,若是有,就会调用表管理模块请求相应的表,并获取对应的锁。表管理模块首先会查看该表是否已经存在于table cache中,若是已经打开则直接进行锁相关的处理,若是没有在cache中,则须要再打开表文件获取锁,而后将打开的表交给表变动管理模块。 

当表变动管理模块“获取”打开的表以后,就会根据该表的相关meta信息,判断表的存储引擎类型和其余相关信息。
根据表的存储引擎类型,提交请求给存储引擎接口模块,调用对应的存储引擎实现模块,进行相应处理。

不过,对于表变动管理模块来讲,可见的仅是存储引擎接口模块所提供的一系列“标准”接口,底层存储引擎实现模块的具体实现,对于表变动管理模块来讲是透明的。他只须要调用对应的接口,并指明表类型,接口模块会根据表类型调用正确的存储引擎来进行相应的处理。 当一条query或者一个command处理完成(成功或者失败)以后,控制权都会交还给链接线程模块。若是处理成功,则将处理结果(多是一个Resultset,也多是成功或者失败的标识)经过链接线程反馈给客户端。
若是处理过程当中发生错误,也会将相应的错误信息发送给客户端,而后链接线程模块会进行相应的清理工做,并继续等待后面的请求,重复上面提到的过程,或者完成客户端断开链接的请求。 

若是在上面的过程当中,相关模块使数据库中的数据发生了变化,并且MySQL打开了bin-log功能,则对应的处理模块还会调用日志处理模块将相应的变动语句以更新事件的形式记录到相关参数指定的二进制日志文件中。 在上面各个模块的处理过程当中,各自的核心运算处理功能部分都会高度依赖整个MySQL的核心API模块,好比内存管理,文件I/O,数字和字符串处理等等。 了解到整个处理过程以后,咱们能够将以上各个模块画成如图2-2的关系图:





相关文章
相关标签/搜索