MYSQL水平拆分与垂直拆分

目前不少互联网系统都存在单表数据量过大的问题,这就下降了查询速度,影响了客户体验。为了提升查询速度,咱们能够优化sql语句,优化表结构和索引,不过对那些百万级千万级的数据库表,即使是优化事后,查询速度仍是知足不了要求。这时候咱们就能够经过分表下降单次查询数据量,从而提升查询速度,通常分表的方式有两种:水平拆分和垂直拆分,二者各有利弊,适用于不一样的状况。sql

水平拆分 
水平拆分是指数据表行的拆分,表的行数超过200万行时,就会变慢,这时能够把一张的表的数据拆成多张表来存放。 
这里写图片描述 
这里写图片描述 
一般状况下,咱们使用取模的方式来进行表的拆分;好比一张有400W的用户表users,为提升其查询效率咱们把其分红4张表users1,users2,users3,users4 
经过用ID取模的方法把数据分散到四张表内Id%4+1 = [1,2,3,4] 
而后查询,更新,删除也是经过取模的方法来查询。数据库

例:QQ的登陆表。假设QQ的用户有100亿,若是只有一张表,每一个用户登陆的时候数据库都要从这100亿中查找,会很慢很慢。若是将这一张表分红100份,每张表有1亿条,就小了不少,好比qq0,qq1,qq1…qq99表。架构

用户登陆的时候,能够将用户的id%100,那么会获得0-99的数,查询表的时候,将表名qq跟取模的数链接起来,就构建了表名。好比123456789用户,取模的89,那么就到qq89表查询,查询的时间将会大大缩短。并发

另外部分业务逻辑也能够经过地区,年份等字段来进行归档拆分;进行拆分后的表,只能知足部分查询的高效查询需求,这时咱们就要在产品策划上,从界面上约束用户查询行为。好比咱们是按年来进行归档拆分的,这个时候在页面设计上就约束用户必需要先选择年,而后才能进行查询;在作分析或者统计时,因为是本身人的需求,多点等待实际上是不要紧的,而且并发很低,这个时候能够用union把全部表都组合成一张视图来进行查询,而后再进行查询。性能

水平拆分的优势: 
◆表关联基本可以在数据库端所有完成; 
◆不会存在某些超大型数据量和高负载的表遇到瓶颈的问题; 
◆应用程序端总体架构改动相对较少; 
◆事务处理相对简单; 
◆只要切分规则可以定义好,基本上较难遇到扩展性限制;优化

水平切分的缺点: 
◆切分规则相对更为复杂,很难抽象出一个可以知足整个数据库的切分规则; 
◆后期数据的维护难度有所增长,人为手工定位数据更困难; 
◆应用系统各模块耦合度较高,可能会对后面数据的迁移拆分形成必定的困难。设计

垂直拆分 
垂直拆分是指数据表列的拆分,把一张列比较多的表拆分为多张表。表的记录并很少,可是字段却很长,表占用空间很大,检索表的时候须要执行大量的IO,严重下降了性能。这时须要把大的字段拆分到另外一个表,而且该表与原表是一对一的关系。 
这里写图片描述 
这里写图片描述blog

一般咱们按如下原则进行垂直拆分: 
1,把不经常使用的字段单独放在一张表;, 
2,把text,blob等大字段拆分出来放在附表中; 
3,常常组合查询的列放在一张表中;索引

例如学生答题表tt:有以下字段: 
Id name 分数 题目 回答 
其中题目和回答是比较大的字段,id name 分数比较小。图片

若是咱们只想查询id为8的学生的分数:select 分数 from tt where id = 8;虽然知识查询分数,可是题目和回答这两个大字段也是要被扫描的,很消耗性能。可是咱们只关心分数,并不想查询题目和回答。这就可使用垂直分割。咱们能够把题目单独放到一张表中,经过id与tt表创建一对一的关系,一样将回答单独放到一张表中。这样咱们插叙tt中的分数的时候就不会扫描题目和回答了。

垂直切分的优势 
◆ 数据库的拆分简单明了,拆分规则明确; 
◆ 应用程序模块清晰明确,整合容易; 
◆ 数据维护方便易行,容易定位;

垂直切分的缺点 
◆ 部分表关联没法在数据库级别完成,须要在程序中完成; 
◆ 对于访问极其频繁且数据量超大的表仍然存在性能平静,不必定能知足要求; 
◆ 事务处理相对更为复杂; 
◆ 切分达到必定程度以后,扩展性会遇到限制; 
◆ 过读切分可能会带来系统过渡复杂而难以维护。

 

 

相关文章
相关标签/搜索