为何主从延时这么大?mysql
答:MySQL使用单线程重放RelayLog。算法
应该怎么优化,缩短重放时间?sql
答:多线程并行重放RelayLog能够缩短期。数据库
答:须要考虑如何分割RelayLog,才可以让多个数据库实例,多个线程并行重放RelayLog,不会出现不一致。多线程
为何会出现不一致?架构
答:若是RelayLog随机的分配给不一样的重放线程,假设RelayLog中有这样三条串行的修改记录:并发
update account set money=100 where uid=58;微服务
update account set money=150 where uid=58;工具
update account set money=200 where uid=58;优化
若是单线程串行重放:能保证全部从库与主库的执行序列一致。
画外音:最后money都将为200。
若是多线程随机分配重放:多重放线程并发执行这3个语句,谁最后执行是不肯定的,最终从库数据可能与主库不一样。
画外音:多个从库可能money为100,150,200不肯定。
如何分配,多个从库多线程重放,也能获得一致的数据呢?
答:相同库上的写操做,用相同的线程来重放RelayLog;不一样库上的写操做,能够并发用多个线程并发来重放RelayLog。
如何作到呢?
答:设计一个哈希算法,hash(db-name) % thread-num,库名hash以后再模上线程数,就能很轻易作到,同一个库上的写操做,被同一个重放线程串行执行。
画外音:不一样库上的重放,是并行的,就起到了加速作用。
这个方案有什么不足?
答:不少公司对MySQL的使用是“单库多表”,若是是这样的话,仍然只有一个库,仍是不能提升RelayLog的重放速度。
启示:将“单库多表”的DB架构模式升级为“多库多表”的DB架构模式。
画外音:数据量大并发量大的互联网业务场景,“多库”模式还具有着其余不少优点,例如:
(1)很是方便的实例扩展:DBA很容易将不一样的库扩展到不一样的实例上;
(2)按照业务进行库隔离:业务解耦,进行业务隔离,减小耦合与相互影响;
(3)很是方便微服务拆分:每一个服务拥有本身的实例就方便了;
“单库多表”的场景,多线程并行重放RelayLog还能怎么优化?
答:即便只有一个库,事务在主库上也是并发执行的,既然在主库上能够并行执行,在从库上也应该可以并行执行呀?
新思路:将主库上同时并行执行的事务,分为一组,编一个号,这些事务在从库上的回放能够并行执行(事务在主库上的执行都进入到prepare阶段,说明事务之间没有冲突,不然就不可能提交),没错,MySQL正是这么作的。
解法:基于GTID的并行复制。
从MySQL5.7开始,将组提交的信息存放在GTID中,使用mysqlbinlog工具,能够看到组提交内部的信息:
20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=1
20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=2
20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=3
20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=4
和原来的日志相比,多了last_committed和sequence_number。
什么是last_committed?
答:它是事务提交时,上次事务提交的编号,若是具有相同的last_committed,说明它们在一个组内,能够并发回放执行。
MySQL并行复制,缩短主从同步时延的方法,体现着这样的一些架构思想:
多线程是一种常见的缩短执行时间的方法;
画外音:例如,不少crontab能够用多线程,切分数据,并行执行。
多线程并发分派任务时,必须保证幂等性:MySQL提供了“按照库幂等”,“按照commit_id幂等”两种方式,很值得借鉴;
画外音:例如,群消息,能够按照group_id幂等;用户消息,能够按照user_id幂等。
具体到MySQL主从同步延时:
mysql5.5:不支持并行复制,大伙快升级MySQL版本;
mysql5.6:按照库并行复制,建议使用“多库”架构;
mysql5.7:按照GTID并行复制;