MySQL8.0.17推出了一个重量级的功能:clone plugin。容许用户能够将当前实例进行本地或者远程的clone。这在某些场景尤为想快速搭建复制备份或者在group replication里加入新成员时很是有用。本文主要试玩下该功能,并试图阐述下其实现的机制是什么。html
咱们以本地clone为例,由于去除网络部分,理解起来会相对简单点。 也不会过分接触代码部分,仅仅作简单的原理性阐述mysql
本地clonesql
本地clone无需启动额外mysqld, 只要在实例上执行一条sql语句,指定下目标目录便可:网络
CLONE LOCAL DATA DIRECTORY [=] 'clone_dir'; root@test 03:49:43>SELECT STAGE, STATE, END_TIME FROM performance_schema.clone_progress; +-----------+-------------+----------------------------+ | STAGE | STATE | END_TIME | +-----------+-------------+----------------------------+ | DROP DATA | Completed | 2019-07-26 12:07:12.285611 | | FILE COPY | Completed | 2019-07-26 12:07:18.270998 | | PAGE COPY | Completed | 2019-07-26 12:07:18.472560 | | REDO COPY | Completed | 2019-07-26 12:07:18.673061 | | FILE SYNC | Completed | 2019-07-26 12:07:32.090219 | | RESTART | Not Started | NULL | | RECOVERY | Not Started | NULL | +-----------+-------------+----------------------------+ 7 rows in set (0.00 sec)
须要BACKUP_ADMIN权限工具
远程clone:sqlserver
CLONE INSTANCE FROM USER@HOST:PORT IDENTIFIED BY 'password' [DATA DIRECTORY [=] 'clone_dir'] [REQUIRE [NO] SSL];
mysql> SET GLOBAL clone_valid_donor_list = 'example.donor.host.com:3306';
mysql> CLONE INSTANCE FROM clone_user@example.donor.host.com:3306url
IDENTIFIED BY 'password';
mysql> CLONE INSTANCE FROM user_name@example.donor.host.com:3306spa
IDENTIFIED BY 'password' DATA DIRECTORY = '/path/to/clone_dir';
官方文档列出的一些限制:线程
主要流程包含以下几个过程:日志
[INIT] ---> [FILE COPY] ---> [PAGE COPY] ---> [REDO COPY] -> [Done]
INIT阶段
须要持有backup lock, 阻止ddl进行
FILE COPY
按照文件进行拷贝,同时开启page tracking功能,记录在拷贝过程当中修改的page, 此时会设置buf_pool->track_page_lsn为当前lsn,track_page_lsn在flush page阶段用到:
buf_flush_page: if (!fsp_is_system_temporary(bpage->id.space()) && buf_pool->track_page_lsn != LSN_MAX) { page_t *frame; lsn_t frame_lsn; frame = bpage->zip.data; if (!frame) { frame = ((buf_block_t *)bpage)->frame; } frame_lsn = mach_read_from_8(frame + FIL_PAGE_LSN); //对于在track_page_lsn以后的page, 若是frame_Lsn大于track_page_lsn, 表示已经记录下page id了,无需重复记录 arch_page_sys->track_page(bpage, buf_pool->track_page_lsn, frame_lsn, false); // 将page id记录下来,表示在track_page_lsn后修改过的page } 会建立一个后套线程page_archiver_thread(),将内存记录的page id flush到disk上
PAGE COPY
这里有两个动做
关于redo archiving,实际上这是官方早就存在的功能,主要用于官方的企业级备份工具,但这里clone利用了该特性来维持增量修改产生的redo。 在开始前会作一次checkpoint, 开启一个后台线程log_archiver_thread()来作日志归档。当有新的写入时(notify_about_advanced_write_lsn
)也会通知他去archive
当arch_log_sys处于活跃状态时,他会控制日志写入以免未归档的日志被覆盖(log_writer_wait_on_archiver
), 注意若是log_writer等待时间过长的话, archive任务会被中断掉
Redo Copy
中止Redo Archiving", 全部归档的日志被发送到目标端,这些日志包含了从page copy阶段开始到如今的全部日志,另外可能还须要记下当前的复制点,例如最后一个事务提交时的binlog位点或者gtid信息,在系统页中能够找到
Done
目标端重启实例,经过crash recovery将redo log应用上去。
官方博客:Clone: Create MySQL instance replica
The Clone Plugin
WL#9209: InnoDB: Clone local replica
WL#9210: InnoDB: Clone remote replica
WL#9682: InnoDB: Support cloning encrypted and compressed database
WL#9211: InnoDB: Clone Replication Coordinates
WL#11636: InnoDB: Clone Remote provisioning
本文做者 :zhaiwx_yinfeng
本文为云栖社区原创内容,未经容许不得转载。