问题:java
高并发这个阶段,确定是须要作读写分离的,啥意思?由于实际上大部分的互联网公司,一些网站,或者是 app,其实都是读多写少。因此针对这个状况,就是写一个主库,可是主库挂多个从库,而后从多个从库来读,那不就能够支撑更高的读并发压力了吗?mysql
其实很简单,就是基于主从复制架构,简单来讲,就搞一个主库,挂多个从库,而后咱们就单单只是写主库,而后主库会自动把数据给同步到从库上去。git
主库将变动写入 binlog 日志,而后从库链接到主库以后,从库有一个 IO 线程,将主库的 binlog 日志拷贝到本身本地,写入一个 relay 中继日志中。接着从库中有一个 SQL 线程会从中继日志读取 binlog,而后执行 binlog 日志中的内容,也就是在本身本地再次执行一遍 SQL,这样就能够保证本身跟主库的数据是同样的。github
这里有一个很是重要的一点,就是从库同步主库数据的过程是串行化的,也就是说主库上并行的操做,在从库上会串行执行。因此这就是一个很是重要的点了,因为从库从主库拷贝日志以及串行执行 SQL 的特色,在高并发场景下,从库的数据必定会比主库慢一些,是有延时的。因此常常出现,刚写入主库的数据多是读不到的,要过几十毫秒,甚至几百毫秒才能读取到。sql
并且这里还有另一个问题,就是若是主库忽然宕机,而后刚好数据还没同步到从库,那么有些数据可能在从库上是没有的,有些数据可能就丢失了。架构
因此 MySQL 实际上在这一块有两个机制,一个是半同步复制,用来解决主库数据丢失问题;一个是并行复制,用来解决主从同步延时问题。并发
这个所谓半同步复制,也叫 semi-sync
复制,指的就是主库写入 binlog 日志以后,就会将强制此时当即将数据同步到从库,从库将日志写入本身本地的 relay log 以后,接着会返回一个 ack 给主库,主库接收到至少一个从库的 ack 以后才会认为写操做完成了。app
所谓并行复制,指的是从库开启多个线程,并行读取 relay log 中不一样库的日志,而后并行重放不一样库的日志,这是库级别的并行。高并发
之前线上确实处理过由于主从同步延时问题而致使的线上的 bug,属于小型的生产事故。网站
是这个么场景。有个同窗是这样写代码逻辑的。先插入一条数据,再把它查出来,而后更新这条数据。在生产环境高峰期,写并发达到了 2000/s,这个时候,主从复制延时大概是在小几十毫秒。线上会发现,天天总有那么一些数据,咱们指望更新一些重要的数据状态,但在高峰期时候却没更新。用户跟客服反馈,而客服就会反馈给咱们。
咱们经过 MySQL 命令:
show status
查看 Seconds_Behind_Master
,能够看到从库复制主库的数据落后了几 ms。
通常来讲,若是主从延迟较为严重,有如下解决方案:
出处:https://github.com/doocs/advanced-java/blob/master/docs/high-concurrency/mysql-read-write-separation.md