MySQL数据库之互联网经常使用架构方案

时间 2019-11-08

标签 mysql 数据库互联网经常使用架构方案栏目 MySQL 繁體版

原文原文链接

1、数据库架构原则

jdbc:mysql://vip:3306/xxdb
html

高可用分析：高可用，主库挂了，keepalive（只是一种工具）会自动切换到备库。这个过程对业务层是透明的，无需修改代码或配置。
高性能分析：读写都操做主库，很容易产生瓶颈。大部分互联网应用读多写少，读会先成为瓶颈，进而影响写性能。另外，备库只是单纯的备份，资源利用率50%，这点方案二可解决。
一致性分析：读写都操做主库，不存在数据一致性问题。
扩展性分析：没法经过加从库来扩展读性能，进而提升总体性能。
可落地分析：两点影响落地使用。第一，性能通常，这点能够经过创建高效的索引和引入缓存来增长读性能，进而提升性能。这也是通用的方案。第二，扩展性差，这点能够经过分库分表来扩展。

jdbc:mysql://vip:3306/xxdbmysql

高可用分析：高可用，一个主库挂了，不影响另外一台主库提供服务。这个过程对业务层是透明的，无需修改代码或配置。
高性能分析：读写性能相比于方案一都获得提高，提高一倍。
一致性分析：存在数据一致性问题。请看，一致性解决方案。
扩展性分析：固然能够扩展成三主循环，但笔者不建议（会多一层数据同步，这样同步的时间会更长）。若是非得在数据库架构层面扩展的话，扩展为方案四。
可落地分析：两点影响落地使用。第一，数据一致性问题，一致性解决方案可解决问题。第二，主键冲突问题，ID统一地由分布式ID生成服务来生成可解决问题。

jdbc:mysql://master-ip:3306/xxdbsql

jdbc:mysql://slave1-ip:3306/xxdb数据库

jdbc:mysql://slave2-ip:3306/xxdb缓存

高可用分析：主库单点，从库高可用。一旦主库挂了，写服务也就没法提供。
高性能分析：大部分互联网应用读多写少，读会先成为瓶颈，进而影响总体性能。读的性能提升了，总体性能也提升了。另外，主库能够不用索引，线上从库和线下从库也能够创建不一样的索引（线上从库若是有多个仍是要创建相同的索引，否则得不偿失；线下从库是平时开发人员排查线上问题时查的库，能够建更多的索引）。
一致性分析：存在数据一致性问题。请看，一致性解决方案。
扩展性分析：能够经过加从库来扩展读性能，进而提升总体性能。（带来的问题是，从库越多须要从主库拉取binlog日志的端就越多，进而影响主库的性能，而且数据同步完成的时间也会更长）
可落地分析：两点影响落地使用。第一，数据一致性问题，一致性解决方案可解决问题。第二，主库单点问题，笔者暂时没想到很好的解决方案。

注：思考一个问题，一台从库挂了会怎样？读写分离之读的负载均衡策略怎么容错？架构

jdbc:mysql://vip:3306/xxdb负载均衡

jdbc:mysql://slave1-ip:3306/xxdb分布式

jdbc:mysql://slave2-ip:3306/xxdb工具

注：图中圈出的是数据同步的地方，数据同步（从库从主库拉取binlog日志，再执行一遍）是须要时间的，这个同步时间内主库和从库的数据会存在不一致的状况。若是同步过程当中有读请求，那么读到的就是从库中的老数据。以下图。post

既然知道了数据不一致性产生的缘由，有下面几个解决方案供参考：

直接忽略，若是业务容许延时存在，那么就不去管它。
强制读主，采用主备架构方案，读写都走主库。用缓存来扩展数据库读性能。有一点须要知道：若是缓存挂了，可能会产生雪崩现象，不过通常分布式缓存都是高可用的。
选择读主，写操做时根据库+表+业务特征生成一个key放到Cache里并设置超时时间（大于等于主从数据同步时间）。读请求时，一样的方式生成key先去查Cache，再判断是否命中。若命中，则读主库，不然读从库。代价是多了一次缓存读写，基本能够忽略。
半同步复制，等主从同步完成，写请求才返回。就是你们常说的“半同步复制”semi-sync。这能够利用数据库原生功能，实现比较简单。代价是写请求时延增加，吞吐量下降。
数据库中间件，引入开源（mycat等）或自研的数据库中间层。我的理解，思路同选择读主。数据库中间件的成本比较高，而且还多引入了一层。

先来看一下经常使用的缓存使用方式：

第一步：淘汰缓存；

第二步：写入数据库；

第三步：读取缓存？返回：读取数据库；

第四步：读取数据库后写入缓存。

注：若是按照这种方式，图一，不会产生DB和缓存不一致问题；图二，会产生DB和缓存不一致问题，即4.read先于3.sync执行。若是不作处理，缓存里的数据可能一直是脏数据。解决方式以下：

注：设置缓存时，必定要加上失效时间，以防延时淘汰缓存失败的状况！

加缓存和索引是通用的提高数据库性能的方式；
分库分表带来的好处是巨大的，但一样也会带来一些问题，详见MySQL数据库之互联网经常使用分库分表方案
不论是主备+分库分表仍是主从+读写分离+分库分表，都要考虑具体的业务场景。某8到家发展四年，绝大部分的数据库架构仍是采用方案一和方案一+分库分表，只有极少部分用方案三+读写分离+分库分表。另外，阿里云提供的数据库云服务也都是主备方案，要想主从+读写分离须要二次架构。
记住一句话：不考虑业务场景的架构都是耍流氓。