mysql存储引擎概述

时间 2019-11-30

标签 mysql 存储引擎概述栏目 MySQL 繁體版

原文原文链接

MySQL体系结构和存储引擎

mysql是一个可移植的数据库，几乎能在当前全部操做系统上运行，如Linux，Mac，Windows等，尽管各类系统在底层（如线程）实现方面各有不一样，可是mysql几乎能保证在各平台上的物理体系结构的一致性。node

定义数据库和实例：
在数据库领域中有两个词很容易混淆，它们就是实例（instance）和数据库（database）。做为常见的数据库术语，这两个词的定义以下：
数据库：物理操做系统文件或其它形式文件类型的集合。在mysql中，数据库文件能够是frm，myd，myi，idb结尾的文件。当使用NDB引擎时，数据库的文件可能不是操做系统上的文件，而是存放于内存中的文件，可是定义仍然不变。
数据库实例：由数据库后台进程/线程以及一个共享内存区组成。共享内存能够被运行的后台进程/线程所共享。须要牢记的是，数据库实例才是真正用来操做数据库文件的。这两个词有时能够互换使用，但二者的概念彻底不一样。在MySQL中，实例和数据库的一般关系是一一对应的，即一个实例对应一个数据库，一个数据库对应一个实例。可是，在集群状况下可能存在一个数据库可被多个实例使用的状况。mysql

mysql被设计为一个单进程多线程架构的数据库，这点与SqlServer比较相似，但与Oracle多进程的架构有所不一样（Oracle的Windows版也是单进程多线程的架构）。这也就是说，mysql数据库实例在系统上的表现就是一个进程。当启动实例时，mysql数据库会去读取配置文件，根据配置文件的参数来启动数据库实例，这与Oracle的参数文件（spfile）类似，不一样的是，在Oracle中若是没有参数文件，启动时会提示找不到该参数文件，数据库启动失败。而在mysql数据库中，能够没有配置文件，这种状况下，mysql会按照编译时的默认参数设置启动实例。算法

mysql体系结构

在平常生活工做中咱们在谈论mysql时，即mysql也是数据库也是数据库实例，你这样理解Oracle和SqlServer多是正确的，但对于之后理解mysql体系结构中的存储引擎可能会带来问题。从概念上说数据库是文件的集合，是依照某种数据模型组织起来并存放于二级存储器中的数据集合，数据库实例是应用程序，是位于用户与操做系统之间的一层数据库管理软件，用户对数据库数据的任何操做，包括数据库定义，数据查询，数据维护，数据库运行控制等，都是在数据库实例下进行的，应用程序只有经过数据库实例才能和数据库打交道。在直白点就是数据库是mysql存储在磁盘上的文件，当咱们执行select,insert,update等操做，不能经过简单的操做文件来更改数据库的内容，须要经过数据库实例来完成对数据库的操做。sql

mysql表存储引擎

mysql是插件式体系结构，存储引擎是mysql区别于其它数据库的一个重要特性。存储引擎的好处是，每一个存储引擎都有各自的特色，可以根据具体的应用创建不一样的存储引擎表。对于开发人员来讲，存储引擎对其是透明的，但了解各类存储引擎的却别对开发人员来讲是有好处的。
mysql是开源的能够根据mysql预约义的存储引擎结果编写本身的存储引擎，若是你对某种存储引擎不满意，能够经过修改源码来实现本身想要的特性。下面是一些常见的存储引擎：数据库

InnoDB存储引擎
InnoDB存储引擎支持事物，主要面向在线事物处理（OLTP）方面的应用，其特色是行锁设计，支持外键，并支持相似于Oracle的非锁定读，即默认状况下读取操做不会产生锁。mysql在Windows版本下innoDB是默认存储引擎，同时innoDB默认被包含在全部的mysql二进制发布版本中。
innoDB存储引擎将数据放在一个逻辑的表空间中，这个表空间就像黑盒同样由innoDB自身进行管理。它能够将每一个innoDB存储引擎的表单独存放到一个独立的idb文件中，与Oracle相似，innoDB存储引擎一样可使用裸设备来创建表空间。
innoDB经过使用多版本并发控制（MVCC）来得到高并发性，而且实现了sql标准的4种隔离级别，默认为REPEATABLE级别，同时使用一种被称为next-key locking的策略来避免幻读（phantom）现象的产生。除此以外，innoDB存储引擎还提供了插入缓冲（insert buffer），二次写（double write），自适应哈希索引（adaptive hash index），预读（read ahead）等高性能和高可用的功能。
对于表中的存储，innoDB存储引擎采用了汇集（clustered）的方式，这种方式相似于Oracle的索引汇集表（index organized table，IOT）。每张表的存储都按主键的顺序存放，若是没有显示的在表定义时指定主键，innoDB存储引擎会为每一行生成一个6字节的ROWID，并以此做为主键。缓存

MyISAM存储引擎
MyISAM存储引擎时mysql官方提供的存储引擎，其特色是不支持事物，表锁和全文索引，对于一些OLAM（online analytical processing 在线分析处理）操做速度快。除Windows版本外，是全部mysql版本默认的存储引擎。
MyISAM存储引擎表由MYD和MYI组成，MYD用来存放数据文件，MYI用来存放索引文件。能够经过使用myisampack工具来进一步压缩数据文件，由于myisampack工具使用赫夫曼编码静态算法来压缩数据，所以使用myisampack工具压缩后的表示只读的，固然你也能够经过myisampack来解压数据文件。
在mysql5.0版本之前，MyISAM默认支持的表大小为4G，若是须要支持大于4G的MyISAM表时，须要指定MAX_ROWS和AVG_ROW_LENGTH属性。mysql5.0版本开始，MyISAM默认支持256T的单表数据，这足够知足通常应用的需求。安全

NDB存储引擎
NDB存储引擎是一个集群存储引擎，相似于Oracle的RAC集群。不过与Oracle RAC share everything结构不一样的是，其结构是share nothing的集群架构，所以还能提供更高级别的高可用性。NDB的特色是数据所有放在内存中，所以主键查找（primary key lookup）的速度极快，而且经过添加NDB数据存储节点（data node）能够线性的提升数据库性能，是高可用，高性能的集群系统。
NDB存储引擎的链接操做时在mysql数据库层完成的，而不是在存储引擎层完成的，这意味着，复杂的链接操做须要巨大的网络开销，所以查询速度很慢。服务器

Memory存储引擎
memory存储引擎将表中的数据存放在内存中，若是数据库重启或发生崩溃，表中的数据都将消失。它很是适合用于存储临时数据的临时表，以及数据库中的纬度表。它默认使用哈希索引，而不是咱们熟悉的B+树索引。
虽然memory存储引擎速度很是快，但在使用上仍是有必定的限制。好比其只支持表锁，并发性能较差，而且不支持TEXT和BLOB列类型。最重要的是，存储变长字段（varchar）时是按照定长字段（char）的方式进行的，所以会浪费内存。
此外有一点长被忽略的是，mysql数据库使用memory存储引擎做为临时表来存放查询的中间结果集。若是中间结果集大于memory存储引擎表的容量设置，又或者中间结果含有TEXT或BLOB列类型字段，则mysql数据库会把其转换到MyISAM存储引擎表而存放到磁盘。网络

Archive存储引擎
archive存储引擎只支持INSERT和SELECT操做，mysql5.1开始支持索引。其使用zlib算法将数据行进行压缩后存储，压缩比率通常可达1:10.正如其名称所示，archive存储引擎很是适合存储归档数据，如日志信息。archive存储引擎使用行锁来实现高并发的插入操做，可是自己并非事物安全的存储引擎，其设计目标主要是提供高速的插入和压缩功能。多线程

federated存储引擎
federated存储引擎表并不存放数据，它只是指向一台远程mysql数据库服务器上的表。这很是相似于sql server的链接服务器和Oracle的透明网管，不一样的是，当前federated存储引擎只支持mysql数据库表，不支持异构数据库表。

Maria存储引擎
Maria存储引擎时新开发的引擎，设计目标主要是用来取代原有的MyISAM存储引擎，从而成为mysql的默认存储引擎，其特色是缓存数据和索引文件，航所设计，提供MVCC功能，支持事物和非事物安全的选项支持，以及更好的OLOB字符类型的处理性能。

数据库基本术语

数据库系统 (DataBase System， DBS)。
数据库管理系统（DataBase Management System， DBMS）。

关系型数据库(Relational database，RDS)：Oracle、MySQL、MariaDB、Percona Server for MySQL、DB2

非关系型数据库(Not Only SQL，NoSQL)：Memcache、Redis、MongoDB、

结构化查询语言（Structured Query Language）：

DDL(Data Definition Language)：数据定义语言其语句包括动词CREATE和DROP。在数据库中建立新表或删除表（CREAT TABLE 或 DROP TABLE），为表加入索引等。DDL包括许多与人数据库目录中得到数据有关的保留字。它也是动做查询的一部分。

DML(Data Manipulation Language)：数据操做语言其语句包括动词INSERT，UPDATE和DELETE。它们分别用于添加，修改和删除表中的行。也称为动做查询语言。

DQL(Data Query Language)：数据查询语言也称为“数据检索语句”，从表中得到数据，保留字SELECT是DQL（也是全部SQL）用得最多的动词，其余DQL经常使用的保留字有WHERE，ORDER BY，GROUP BY和HAVING。这些DQL保留字常与其余类型的SQL语句一块儿使用。

DCL(Data Control Language)：数据控制语言它的语句经过GRANT或REVOKE得到许可，肯定单个用户和用户组对数据库对象的访问。某些RDBMS可用GRANT或REVOKE控制对表单个列的访问。
TPL（Transaction Processing Language）：事务处理语言它的语句能确保被DML语句影响的表的全部行及时得以更新。TPL语句包括BEGIN TRANSACTION，COMMIT和ROLLBACK。