分表是分散数据库压力的好方法。
分表,最直白的意思,就是将一个表结构分为多个表,而后,能够再同一个库里,也能够放到不一样的库。 固然,首先要知道什么状况下,才须要分表。我的以为单表记录条数达到百万到千万级别时就要使用分表了。 1,分表的分类 1>纵向分表 将原本能够在同一个表的内容,人为划分为多个表。(所谓的原本,是指按照关系型数据库的第三范式要求,是应该在同一个表的。) 分表理由:根据数据的活跃度进行分离,(由于不一样活跃的数据,处理方式是不一样的) 案例: 对于一个博客系统,文章标题,做者,分类,建立时间等,是变化频率慢,查询次数多,并且最好有很好的实时性的数据,咱们把它叫作冷数据。而博客的浏览量,回复数等,相似的统计信息,或者别的变化频率比较高的数据,咱们把它叫作活跃数据。因此,在进行数据库结构设计的时候,就应该考虑分表,首先是纵向分表的处理。 这样纵向分表后: 首先存储引擎的使用不一样,冷数据使用MyIsam 能够有更好的查询数据。活跃数据,可使用Innodb ,能够有更好的更新速度。 其次,对冷数据进行更多的从库配置,由于更多的操做时查询,这样来加快查询速度。对热数据,能够相对有更多的主库的横向分表处理。 其实,对于一些特殊的活跃数据,也能够考虑使用memcache ,redis之类的缓存,等累计到必定量再去更新数据库。或者mongodb 一类的nosql 数据库,这里只是举例,就先不说这个。 2>横向分表 字面意思,就能够看出来,是把大的表结构,横向切割为一样结构的不一样表,如,用户信息表,user_1,user_2 等。表结构是彻底同样,可是,根据某些特定的规则来划分的表,如根据用户ID来取模划分。 分表理由:根据数据量的规模来划分,保证单表的容量不会太大,从而来保证单表的查询等处理能力。 案例:同上面的例子,博客系统。当博客的量达到很大时候,就应该采起横向分割来下降每一个单表的压力,来提高性能。例如博客的冷数据表,假如分为100个表,当同时有100万个用户在浏览时,若是是单表的话,会进行100万次请求,而如今分表后,就多是每一个表进行1万个数据的请求(由于,不可能绝对的平均,只是假设),这样压力就下降了不少不少。 数据库的复制能解决访问问题,并不能解决大规模的并发写入问题,要解决这个问题就要考虑mysql数据切分了 数据切分,顾名思义,就是数据分散,将一台主机上的数据分摊到多台,减轻单台主机的负载压力,有两种切分方式,一种是分库,即按照业务模块分多个库,每一个库中的表不同,还有一种就是分表,按照必定的业务规则或者逻辑将数据拆分到不一样的主机上,每一个主机上的表是同样的,这个有点相似于Oracle的表分区。 分库又叫垂直分区,这种方式实现起来比较简单,重要的是对业务要细化,分库时候要想清楚各个模块业务之间的交互状况,避免未来写程序时出现过多的跨库操做。 分表又叫水平分区,这种方式实现起来就比垂直分区复杂些,可是它能解决垂直分区所不能解决的问题,即单张表的访问及写入很频繁,这时候就能够根据必定的业务规则(PS:如互联网BBS论坛的会员等级概念:根据会员等级来分表)来分表,这样就能减轻单表压力,而且还能解决各个模块的之间的频繁交互问题。 分库的优势是:实现简单,库与库之间界限分明,便于维护,缺点是不利于频繁跨库操做,单表数据量大的问题解决不了。 分表的优势是:能解决分库的不足点,可是缺点却偏偏是分库的优势,分表实现起来比较复杂,特别是分表规则的划分,程序的编写,以及后期的数据库拆分移植维护。 实际应用中,通常互联网企业的路线都是先分库再分表,二者结合使用,取长补短,这样发挥了mysql扩展的最大优点,可是缺点是架构很大,很复杂,应用程序的编写也比较复杂。 以上是mysql的数据切分的一些概念,数据切完了,如今要作的是怎么样在整合起来以便于外界访问,由于程序访问的入口永远只有一个,如今比较经常使用的解决方案是经过中间代理层来统一管控全部数据源。