总的来讲,MySQL 能够当作是二层架构,第一层咱们一般叫作SQL Layer,在MySQL 数据库系统处理底层数据以前的全部工做都是在这一层完成的,包括权限判断,sql 解析,执行计划优化,querycache 的处理等等;第二层就是存储引擎层,咱们一般叫作Storage Engine Layer,也就是底层数据存取操做实现部分,由多种存储引擎共同组成。因此,能够用以下一张最简单的架构示意图来表示MySQL 的基本架构,如图2-1 所示:算法
虽然从上图看起来MySQL 架构很是的简单,就是简单的两部分而已,但实际上每一层中都含有各自的不少小模块,尤为是第一层SQL Layer,结构至关复杂的。下面咱们就分别针对SQL Layer 和Storage Engine Layer 作一个简单的分析。sql
SQL Layer 中包含了多个子模块,下面我将逐个作一下简单的介绍:数据库
一、初始化模块api
顾名思议,初始化模块就是在MySQL Server 启动的时候,对整个系统作各类各样的初始化操做,好比各类buffer,cache 结构的初始化和内存空间的申请,各类系统变量的初始化设定,各类存储引擎的初始化设置,等等。缓存
二、核心API安全
核心API 模块主要是为了提供一些须要很是高效的底层操做功能的优化实现,包括各类底层数据结构的实现,特殊算法的实现,字符串处理,数字处理等,小文件I/O,格式化输出,以及最重要的内存管理部分。核心API 模块的全部源代码都集中在mysys和strings文件夹下面,有兴趣的读者能够研究研究。网络
三、网络交互模块数据结构
底层网络交互模块抽象出底层网络交互所使用的接口api,实现底层网络数据的接收与发送,以方便其余各个模块调用,以及对这一部分的维护。全部源码都在vio 文件夹下面。架构
四、Client& Server 交互协议模块socket
任何C/S 结构的软件系统,都确定会有本身独有的信息交互协议,MySQL 也不例外。MySQL的Client & Server 交互协议模块部分,实现了客户端与MySQL 交互过程当中的全部协议。固然这些协议都是创建在现有的OS 和网络协议之上的,如TCP/IP 以及Unix Socket。
五、用户模块
用户模块所实现的功能,主要包括用户的登陆链接权限控制和用户的受权管理。他就像MySQL 的大门守卫同样,决定是否给来访者“开门”。
六、访问控制模块
造访客人进门了就能够想干吗就干吗么?为了安全考虑,确定不能如此随意。这时候就须要访问控制模块实时监控客人的每个动做,给不一样的客人以不一样的权限。访问控制模块实现的功能就是根据用户模块中各用户的受权信息,以及数据库自身特有的各类约束,来控制用户对数据的访问。用户模块和访问控制模块二者结合起来,组成了MySQL 整个数据库系统的权限安全管理的功能。
七、链接管理、链接线程和线程管理
链接管理模块负责监听对MySQL Server 的各类请求,接收链接请求,转发全部链接请求到线程管理模块。每个链接上MySQL Server 的客户端请求都会被分配(或建立)一个链接线程为其单独服务。而链接线程的主要工做就是负责MySQL Server 与客户端的通讯,接受客户端的命令请求,传递Server 端的结果信息等。线程管理模块则负责管理维护这些链接线程。包括线程的建立,线程的cache 等。
八、Query 解析和转发模块
在MySQL 中咱们习惯将全部Client端发送给Server 端的命令都称为query,在MySQL Server 里面,链接线程接收到客户端的一个Query 后,会直接将该query 传递给专门负责将各类Query 进行分类而后转发给各个对应的处理模块,这个模块就是query 解析和转发模块。其主要工做就是将query 语句进行语义和语法的分析,而后按照不一样的操做类型进行分类,而后作出针对性的转发。
九、QueryCache 模块
Query Cache 模块在MySQL 中是一个很是重要的模块,他的主要功能是将客户端提交给MySQL 的Select 类query 请求的返回结果集cache 到内存中,与该query 的一个hash 值作一个对应。该Query 所取数据的基表发生任何数据的变化以后,MySQL 会自动使该query 的Cache 失效。在读写比例很是高的应用系统中,Query Cache 对性能的提升是很是显著的。固然它对内存的消耗也是很是大的。
十、Query 优化器模块
Query 优化器,顾名思义,就是优化客户端请求的query,根据客户端请求的query 语句,和数据库中的一些统计信息,在一系列算法的基础上进行分析,得出一个最优的策略,告诉后面的程序如何取得这个query 语句的结果。
十一、表变动管理模块
表变动管理模块主要是负责完成一些DML 和DDL 的query,如:update,delte,insert,create table,alter table 等语句的处理。
十二、表维护模块
表的状态检查,错误修复,以及优化和分析等工做都是表维护模块须要作的事情。
1三、系统状态管理模块
系统状态管理模块负责在客户端请求系统状态的时候,将各类状态数据返回给用户,像DBA 经常使用的各类showstatus 命令,showvariables 命令等,所获得的结果都是由这个模块返回的。
1四、表管理器
这个模块从名字上看来很容易和上面的表变动和表维护模块相混淆,可是其功能与变动及维护模块却彻底不一样。你们知道,每个MySQL 的表都有一个表的定义文件,也就是*.frm文件。表管理器的工做主要就是维护这些文件,以及一个cache,该cache 中的主要内容是各个表的结构信息。此外它还维护table 级别的锁管理。
1五、日志记录模块
日志记录模块主要负责整个系统级别的逻辑层的日志的记录,包括error log,binary log,slow query log 等。
1六、复制模块
复制模块又可分为Master 模块和Slave 模块两部分, Master 模块主要负责在Replication 环境中读取Master 端的binary 日志,以及与Slave 端的I/O 线程交互等工做。
Slave 模块比Master 模块所要作的事情稍多一些,在系统中主要体如今两个线程上面。一个是负责从Master请求和接受binary 日志,并写入本地relay log 中的I/O 线程。另一个是负责从relay log 中读取相关日志事件,而后解析成能够在Slave 端正确执行并获得和Master端彻底相同的结果的命令并再交给Slave 执行的SQL 线程。
1七、存储引擎接口模块
存储引擎接口模块能够说是MySQL 数据库中最有特点的一点了。目前各类数据库产品中,基本上只有MySQL 能够实现其底层数据存储引擎的插件式管理。这个模块实际上只是一个抽象类,但正是由于它成功地将各类数据处理高度抽象化,才成就了今天MySQL 可插拔存储引擎的特点。
在了解了MySQL 的各个模块以后,咱们再看看MySQL各个模块间是如何相互协同工做的。
接下来,咱们经过启动MySQL,客户端链接,请求query,获得返回结果,最后退出,这样一整个过程来进行分析。
当咱们执行启动MySQL 命令以后,MySQL 的初始化模块就从系统配置文件中读取系统参数和命令行参数,并按照参数来初始化整个系统,如申请并分配buffer,初始化全局变量,以及各类结构等。同时各个存储引擎也被启动,并进行各自的初始化工做。当整个系统初始化结束后,由链接管理模块接手。链接管理模块会启动处理客户端链接请求的监听程序,包括tcp/ip 的网络监听,还有unix 的socket。这时候,MySQL Server 就基本启动完成,准备好接受客户端请求了。
当链接管理模块监听到客户端的链接请求(借助网络交互模块的相关功能),双方经过Client & Server 交互协议模块所定义的协议“寒暄”几句以后,链接管理模块就会将链接请求转发给线程管理模块,去请求一个链接线程。
线程管理模块立刻又会将控制交给链接线程模块,告诉链接线程模块:如今我这边有链接请求过来了,须要创建链接,你赶快处理一下。链接线程模块在接到链接请求后,首先会检查当前链接线程池中是否有被cache 的空闲链接线程,若是有,就取出一个和客户端请求链接上,若是没有空闲的链接线程,则创建一个新的链接线程与客户端请求链接。固然,链接线程模块并非在收到链接请求后立刻就会取出一个链接线程连和客户端链接,而是首先经过调用用户模块进行受权检查,只有客户端请求经过了受权检查后,他才会将客户端请求和负责请求的链接线程连上。
在MySQL 中,将客户端请求分为了两种类型:一种是query,须要调用Parser 也就是Query 解析和转发模块的解析才可以执行的请求;一种是command,不须要调用Parser 就能够直接执行的请求。若是咱们的初始化配置中打开了Full QueryLogging 的功能,那么Query 解析与转发模块会调用日志记录模块将请求计入日志,无论是一个Query 类型的请求仍是一个command 类型的请求,都会被记录进入日志,因此出于性能考虑,通常不多打开Full QueryLogging 的功能。
当客户端请求和链接线程“互换暗号(互通协议)”接上头以后,链接线程就开始处理客户端请求发送过来的各类命令(或者query),接受相关请求。它将收到的query语句转给Query 解析和转发模块,Query 解析器先对Query 进行基本的语义和语法解析,而后根据命令类型的不一样,有些会直接处理,有些会分发给其余模块来处理。
若是是一个Query 类型的请求,会将控制权交给Query解析器。Query 解析器首先分析看是否是一个select 类型的query,若是是,则调用查询缓存模块,让它检查该query 在query cache 中是否已经存在。若是有,则直接将cache 中的数据返回给链接线程模块,而后经过与客户端的链接的线程将数据传输给客户端。若是不是一个能够被cache 的query类型,或者cache 中没有该query 的数据,那么query 将被继续传回query 解析器,让query解析器进行相应处理,再经过query 分发器分发给相关处理模块。
若是解析器解析结果是一条未被cache 的select 语句,则将控制权交给Optimizer,也就是Query 优化器模块,若是是DML 或者是DDL 语句,则会交给表变动管理模块,若是是一些更新统计信息、检测、修复和整理类的query 则会交给表维护模块去处理,复制相关的query 则转交给复制模块去进行相应的处理,请求状态的query 则转交给了状态收集报告模块。实际上表变动管理模块根据所对应的处理请求的不一样,是分别由insert 处理器、delete 处理器、update 处理器、create 处理器,以及alter 处理器这些小模块来负责不一样的DML和DDL 的。
在各个模块收到Query 解析与分发模块分发过来的请求后,首先会经过访问控制模块检查链接用户是否有访问目标表以及目标字段的权限,若是有,就会调用表管理模块请求相应的表,并获取对应的锁。表管理模块首先会查看该表是否已经存在于table cache 中,若是已经打开则直接进行锁相关的处理,若是没有在cache 中,则须要再打开表文件获取锁,而后将打开的表交给表变动管理模块。
当表变动管理模块“获取”打开的表以后,就会根据该表的相关meta 信息,判断表的存储引擎类型和其余相关信息。根据表的存储引擎类型,提交请求给存储引擎接口模块,调用对应的存储引擎实现模块,进行相应处理。
不过,对于表变动管理模块来讲,可见的仅是存储引擎接口模块所提供的一系列“标准”接口,底层存储引擎实现模块的具体实现,对于表变动管理模块来讲是透明的。他只须要调用对应的接口,并指明表类型,接口模块会根据表类型调用正确的存储引擎来进行相应的处理。
当一条query 或者一个command 处理完成(成功或者失败)以后,控制权都会交还给链接线程模块。若是处理成功,则将处理结果(多是一个Result set,也多是成功或者失败的标识)经过链接线程反馈给客户端。若是处理过程当中发生错误,也会将相应的错误信息发送给客户端,而后链接线程模块会进行相应的清理工做,并继续等待后面的请求,重复上面提到的过程,或者完成客户端断开链接的请求。
若是在上面的过程当中,相关模块使数据库中的数据发生了变化,并且MySQL 打开了binlog 功能,则对应的处理模块还会调用日志处理模块将相应的变动语句以更新事件的形式记录到相关参数指定的二进制日志文件中。
在上面各个模块的处理过程当中,各自的核心运算处理功能部分都会高度依赖整个MySQL的核心API 模块,好比内存管理,文件I/O,数字和字符串处理等等。
了解到整个处理过程以后,咱们能够将以上各个模块画成如图2-2 的关系图:
下面这个是官方文档里的一个图:
本文转载自:http://blog.csdn.net/tianlesoftware/article/details/7029112