数据库设计之选择合适的表引擎

什么是表引擎
咱们看到的表结构,它的本质是数据在硬盘中的存储。根据不一样的特性,数据的存储方式不一样。好比:对于每一条数据,在硬盘中它是怎么存储的,怎么压缩的,怎么创建索引和优化的,它的读取和写入是怎么实现的。这些完整的一条路径,咱们称之为表引擎。
选择的依据
选择的依据,是咱们的需求,咱们的需求很大程度上决定咱们的选择。有的时候,咱们的习惯决策着这个过程。这里,咱们关注一下方面:
mysql



  • 并发性,同一时间支持的写入和读取特性;sql

  • 安全性,物理存储结构,异常发生时数据的是否可靠;缓存

  • 事务性,数据执行的颗粒,以及提供的定义原子操做的特性;安全

  • 查询优化,这里咱们指查询缓存和索引;
    服务器

在开发上,咱们主要关注:(1,3,4),在运维层面,咱们关注(2)。
在表的选择上,最经常使用的是以下:
并发



  • MyIsam运维

  • Innodb性能

  • Memory(Heap)
    优化

从案例开始
如今咱们要作一个留言板,咱们发现这个留言板可能有几种状况:
spa



  • 有不少人同时留言,同时,查看留言的人也不少;

  • 留言的人不多,天天查看留言的人很是多;

  • 咱们的功能有留言奖励,天天前10个留言的,会有积分奖励;

  • 咱们的留言板有点像实时聊天器,对性能要求和实时性要求很是高;

MYSIAM
在5.0的时代,这个表是使用得很是广泛的,我了解的Discuz就是使用这种表。它的优点:查询速度,被不少人看重。咱们看看它的一些特色:



  • 理论上存储无限制(与操做系统的文件系统有关)

  • 存在text/blob全文索引

  • 索引缓存

  • 数据压缩

  • 低存储空间和低内存占用

  • 高速写入

  • 查询缓存

  • 串行写入时,全表锁(读和写)

  • 不支持事务

  • 集群支持

  • B-Tree索引

create table a_myisam (.....) ENGINE = MYISAM;

以上特性,咱们看到MyIsam主要是为查询而设计的,也是最初你们作数据存储时考虑的东西。
InnoDB 从5.1开始,InnoDB慢慢发展起来,而且成为重要数据的存储引擎。它的特色以下:



  • 有限制的存储

  • 索引缓存

  • 支持事务

  • 查询缓存

  • 写入行锁

  • B-Tree索引

create table a_myisam (.....) ENGINE = InnoDB;

InnoDB更加稳定和成熟,也为更多需求提供解决方案。
Memory



  • 查询速度快

  • mysql重启后丢失

  • B-Tree和HASH索引

仅仅是为了快,小量数据。
A:不少人同时留言,看留言的人也不少
这意味着什么?咱们的写入速度要够快且写入不影响读取。或者,咱们能够并行写入。这种状况,若是咱们选择MyIsam,写入量的增长会致使全表上锁,以致于读取时,要等待锁的释放;那么,显然,MyIsam会形成表性能瓶颈。这种状况,咱们选择Innodb。理由以下:



  • Innodb写入时,锁为行锁;不影响其它写入,影响少许读(有可能大量);

  • Innodb的查询性能理论上比Myisam稍差,可是很是小,可忽略;

B:留言的人不多,天天查看留言的人很是多
这个时候,选择MyIsam,没有什么问题。(读/写比较高)
C:咱们的功能有留言奖励,天天前10个留言的,会有积分奖励
咱们须要一些原子级别的操做,也就是在判断某条留言是前10名的时候,就将它标记,而这个标记须要原子级的:标记的过程当中不容许别人查询和写入(全表锁)。这是什么意思?因为咱们的操做是没有严格的先后顺序的,计算机的CPU运算分片本质是串行的。假设这个时候你有两条命令:



  • 查询是否前10个

  • 增长积分

假设如今已经有9个条留言了,那么这个时候来了两个请求,都查询本身是不是前10个。第一个用户查到本身是第10个,而后在它要执行第二步的时候,第11个用户来了,他也查询本身是第10个,若是没有保护机制,那么第11个也被认为是知足条件,他也会被加分。
如何实现?
通常状况下咱们会增长一个字段来作标记,这个字段假设为:lock,那么更新的时候保证这个中间是没有其它操做的。咱们称之为事务。

start
select ... from table where lock = 0 for update;
update table set lock = 1;
commit

D:咱们的留言板有点像实时聊天器,对性能要求和实时性要求很是高
呵呵,这个不用说了,使用innodb和memory均可以。通常咱们使用内存存储,会把它当作K-V来使用,根据设计的状况来选择。(不过,业内不多时候,内存的存储通常都会选择Memcache和Redis)。
总结一下



  • 若是读/写 比很大的话,假设这个尺度为10,那么,就使用myisam(写入并发小的状况)

  • 若是须要事务的支持,使用innodb

  • 若是须要对并发性(写入)有要求的话,使用innodb

  • 其它状况,能够根据实际场景选择

问答



  • 主从库可使用不一样的引擎么?
    答:这个我没有作过,还不了解;你们能够本身查一下(mysql手册)

  • 我想多问一点,使用memory或者Memcache和Redis,是否是相比myisam或innodb引擎对服务器内存的要求或占用高不少?答:对的,有专门的内存服务器来干这件事;

相关文章
相关标签/搜索