MySQL学习笔记之二---引擎介绍MyISAM VS InnoDB

前言
MyISAM是MySQL的默认数据库引擎(5.5版以前),由早期的ISAM(Indexed Sequential Access Method:有索引的顺序访问方法)所改良。虽然性能极佳,但却有一个缺点:不支持事务处理(transaction)。不过,在这几年的发展 下,MySQL也导入了InnoDB(另外一种数据库引擎),以强化参考完整性与并发违规处理机制,后来就逐渐取代MyISAM。
 
Innodb引擎
Innodb引擎提供了对数据库ACID事务的支持,而且实现了SQL标准的四种隔离级别,关于数据库事务与其隔离级别的内容请见数据库事务与其隔 离级别这篇文章。该引擎还提供了行级锁和外键约束,它的设计目标是处理大容量数据库系统,它自己其实就是基于MySQL后台的完整数据库系统,MySQL 运行时Innodb会在内存中创建缓冲池,用于缓冲数据和索引。可是该引擎不支持FULLTEXT类型的索引,并且它没有保存表的行数,当SELECT COUNT(*) FROM TABLE时须要扫描全表。当须要使用数据库事务时,该引擎固然是首选。因为锁的粒度更小,写操做不会锁定全表,因此在并发较高时,使用Innodb引擎 会提高效率。可是使用行级锁也不是绝对的,若是在执行一个SQL语句时MySQL不能肯定要扫描的范围,InnoDB表一样会锁全表。
 
MyIASM引擎
MyIASM是MySQL默认的引擎,可是它没有提供对数据库事务的支持,也不支持行级锁和外键,所以当INSERT(插入)或UPDATE(更 新)数据时即写操做须要锁定整个表,效率便会低一些。不过和Innodb不一样,MyIASM中存储了表的行数,因而SELECT COUNT(*) FROM TABLE时只须要直接读取已经保存好的值而不须要进行全表扫描。若是表的读操做远远多于写操做且不须要数据库事务的支持,那么MyIASM也是很好的选 择。
 
两种引擎的选择
大尺寸的数据集趋向于选择InnoDB引擎,由于它支持事务处理和故障恢复。数据库的大小决定了故障恢复的时间长短,InnoDB能够利用事务日志 进行数据恢复,这会比较快。主键查询在InnoDB引擎下也会至关快,不过须要注意的是若是主键太长也会致使性能问题,关于这个问题我会在下文中讲到。大 批的INSERT语句(在每一个INSERT语句中写入多行,批量插入)在MyISAM下会快一些,可是UPDATE语句在InnoDB下则会更快一些,尤 其是在并发量大的时候。
Index——索引
索引(Index)是帮助MySQL高效获取数据的数据结构。MyIASM和Innodb都使用了树这种数据结构作为索引,关于树我也曾经写过一篇 文章树是一种伟大的数据结构,只是本身的理解,有兴趣的朋友能够去阅读。下面我接着讲这两种引擎使用的索引结构,讲到这里,首先应该谈一下B-Tree和 B+Tree。
B-Tree和B+Tree
B+Tree是B-Tree的变种,那么我就先讲B-Tree吧,相信你们都知道红黑树,这是我前段时间学《算法》一书时,实现的一颗红黑树,你们 能够参考。其实红黑树相似2,3-查找树,这种树既有2叉结点又有3叉结点。B-Tree也与之相似,它的每一个结点作多能够有d个分支(叉),d称为B- Tree的度,以下图所示,它的每一个结点能够有4个元素,5个分支,因而它的度为5。B-Tree中的元素是有序的,好比图中元素7左边的指针指向的结点 中的元素都小于7,而元素7和16之间的指针指向的结点中的元素都处于7和16之间,正是知足这样的关系,才能高效的查找:首先从根节点进行二分查找,找 到就返回对应的值,不然就进入相应的区间结点递归的查找,直到找到对应的元素或找到null指针,找到null指针则表示查找失败。这个查找是十分高效 的,其时间复杂度为O(logN)(以d为底,当d很大时,树的高度就很低),由于每次检索最多只须要检索树高h个结点。
 
接下来就该讲B+Tree了,它是B-Tree的变种,以下面两张图所示:
 
 
从图中就能够看出,B+Tree的内部结点不存储数据,只存储指针,而叶子结点则只存储数据,不存储指针。而且在其每一个叶子节点上增长了一个指向相 邻叶子节点的指针,这个优化提升区间访问的性能,好比在第二张图中要查询键为从18到49的全部数据,当找到18后,只需顺着节点和指针顺序遍历就能够一 次性访问到全部数据节点,极大提到了区间查询效率。
MyISAM引擎的索引结构
MyISAM引擎的索引结构为B+Tree,其中B+Tree的数据域存储的内容为实际数据的地址,也就是说它的索引和实际的数据是分开的,只不过是用索引指向了实际的数据,这种索引就是所谓的非汇集索引。
Innodb引擎的索引结构
MyISAM引擎的索引结构一样也是B+Tree,可是Innodb的索引文件自己就是数据文件,即B+Tree的数据域存储的就是实际的数据,这种索引就是汇集索引。这个索引的key就是数据表的主键,所以InnoDB表数据文件自己就是主索引。
由于InnoDB的数据文件自己要按主键汇集,因此InnoDB要求表必须有主键(MyISAM能够没有),若是没有显式指定,则MySQL系统会 自动选择一个能够惟一标识数据记录的列做为主键,若是不存在这种列,则MySQL自动为InnoDB表生成一个隐含字段做为主键,这个字段长度为6个字 节,类型为长整形。
而且和MyISAM不一样,InnoDB的辅助索引数据域存储的也是相应记录主键的值而不是地址,因此当以辅助索引查找时,会先根据辅助索引找到主 键,再根据主键索引找到实际的数据。因此Innodb不建议使用过长的主键,不然会使辅助索引变得过大。建议使用自增的字段做为主键,这样B+Tree的 每个结点都会被顺序的填满,而不会频繁的分裂调整,会有效的提高插入数据的效率。
 
MyISAM与InnoDB的区别是什么?
一、 存储结构
MyISAM:每一个MyISAM在磁盘上存储成三个文件。第一个文件的名字以表的名字开始,扩展名指出文件类型。.frm文件存储表定义。数据文件的扩展名为.MYD (MYData)。索引文件的扩展名是.MYI (MYIndex)。
InnoDB:全部的表都保存在同一个数据文件中(也多是多个文件,或者是独立的表空间文件),InnoDB表的大小只受限于操做系统文件的大小,通常为2GB。
二、 存储空间
MyISAM:可被压缩,存储空间较小。支持三种不一样的存储格式:静态表(默认,可是注意数据末尾不能有空格,会被去掉)、动态表、压缩表。
InnoDB:须要更多的内存和存储,它会在主内存中创建其专用的缓冲池用于高速缓冲数据和索引。
三、 可移植性、备份及恢复
MyISAM:数据是以文件的形式存储,因此在跨平台的数据转移中会很方便。在备份和恢复时可单独针对某个表进行操做。
InnoDB:免费的方案能够是拷贝数据文件、备份 binlog,或者用 mysqldump,在数据量达到几十G的时候就相对痛苦了。
四、 事务支持
MyISAM:强调的是性能,每次查询具备原子性,其执行数度比InnoDB类型更快,可是不提供事务支持。
InnoDB:提供事务支持事务,外部键等高级数据库功能。 具备事务(commit)、回滚(rollback)和崩溃修复能力(crash recovery capabilities)的事务安全(transaction-safe (ACID compliant))型表。
五、 AUTO_INCREMENT
MyISAM:能够和其余字段一块儿创建联合索引。引擎的自动增加列必须是索引,若是是组合索引,自动增加能够不是第一列,他能够根据前面几列进行排序后递增。
InnoDB:InnoDB中必须包含只有该字段的索引。引擎的自动增加列必须是索引,若是是组合索引也必须是组合索引的第一列。
六、 表锁差别
MyISAM:只支持表级锁,用户在操做myisam表时,select,update,delete,insert语句都会给表自动加锁,若是加锁之后的表知足insert并发的状况下,能够在表的尾部插入新的数据。
InnoDB:支持事务和行级锁,是innodb的最大特点。行锁大幅度提升了多用户并发操做的新能。可是InnoDB的行锁,只是在WHERE的主键是有效的,非主键的WHERE都会锁全表的。
七、 全文索引
MyISAM:支持 FULLTEXT类型的全文索引
InnoDB:不支持FULLTEXT类型的全文索引,可是innodb可使用sphinx插件支持全文索引,而且效果更好。
八、 表主键
MyISAM:容许没有任何索引和主键的表存在,索引都是保存行的地址。
InnoDB:若是没有设定主键或者非空惟一索引,就会自动生成一个6字节的主键(用户不可见),数据是主索引的一部分,附加索引保存的是主索引的值。
九、 表的具体行数
MyISAM:保存有表的总行数,若是select count(*) from table;会直接取出出该值。
InnoDB:没有保存表的总行数,若是使用select count(*) from table;就会遍历整个表,消耗至关大,可是在加了wehre条件后,myisam和innodb处理的方式都同样。
十、 CURD操做
MyISAM:若是执行大量的SELECT,MyISAM是更好的选择。
InnoDB:若是你的数据执行大量的INSERT或UPDATE,出于性能方面的考虑,应该使用InnoDB表。DELETE 从性能上InnoDB更优,但DELETE FROM table时,InnoDB不会从新创建表,而是一行一行的删除,在innodb上若是要清空保存有大量数据的表,最好使用truncate table这个命令。
十一、 外键
MyISAM:不支持
InnoDB:支持
经过上述的分析,基本上能够考虑使用InnoDB来替代MyISAM引擎了,缘由是InnoDB自身不少良好的特色,好比事务支持、存储 过程、视图、行级锁定等等,在并发不少的状况下,相信InnoDB的表现确定要比MyISAM强不少。另外,任何一种表都不是万能的,只用恰当的针对业务 类型来选择合适的表类型,才能最大的发挥MySQL的性能优点。若是不是很复杂的Web应用,非关键应用,仍是能够继续考虑MyISAM的,这个具体状况 能够本身斟酌。
相关文章
相关标签/搜索