欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Percona-Toolkit 之 pt-table-sync 总结

程序员文章站 2022-05-21 17:18:31
pt table sync Synchronize MySQL table data efficiently. pt table sync synchronizes data efficiently between MySQL tables. pt table sync 是Percona Toolk ......

pt-table-sync - synchronize mysql table data efficiently.

pt-table-sync synchronizes data efficiently between mysql tables.

pt-table-sync是percona-toolkit工具集中的一个组件,主要用于表数据的高效同步。

因为涉及到数据的修改,所以为了安全,建议在工具修改数据前先进行备份。在主从环境下,它所做的变更都是基于主库,而不是直接修改从库,因为这是保持主从复制数据一致性最佳方式。一般情况下出现主从数据不一致都是由于从库发生了变化,因此,工具进行同步数据时并不会影响主库当前的数据,而是影响从库的数据以达到一致性。

pt-table-sync工具可以用来修复由另一个工具pt-table-checksum检查校验出主从不一致的表数据进行修复。关于工具pt-table-checksum的使用可以参考我另一篇博文:percona-toolkit 之 pt-table-checksum 总结

本文是关于之前有关pt-table-checksum工具使用的学习笔记进行重新整理,使用最新版本的工具同时也进行原理知识的梳理。

关于获取和安装percona-toolkit工具集可以参考我另一篇博文:percona-toolkit 之 pt-online-schema-change 总结中的安装部分。

基本说明

pt-table-sync [options] dsn [dsn]

常用选项(options)

--ask-pass
命令行提示密码输入,保护密码安全,前提需安装模块perl-termreadkey。

--[no]bin-log
默认值:yes
指定同步操作记录二进制日志,相当于执行set sql_log_bin=1。如果指定'--no-bin-log',则对应执行set sql_log_bin=0。

--channel
指定当主从复制环境是多源复制时需要进行同步哪个主库的数据,适用于多源复制中多个主库对应一个从库的情形。

--charset,-a
指定连接字符集。

--[no]check-child-tables
默认值:yes
指定检查当同步指定选项'--execute'时是否会对同步的表的子表(如有存在)有影响。当指定选项'--replace'、'--replicate'或'--sync-to-master'时,同步使用的replace语句,如果被同步的表存在子表,并且子表有'on delete cascade'、'on update cascade'或'on update set null'选项时,工具会打印报错信息并跳过该表的同步,因为replace语句会先进行delete然后再进行insert操作,这会导致子表删除数据。
可以指定选项'--no-check-child-tables'不进行检查,如果同时不影响子表还需要指定选项'--no-foreign-key-checks',这样被同步表的操作不会级联影响到它的子表。
该选项对应的检查只当指定选项'--execute'和选项('--replace'、'--replicate'和'--sync-to-master')其中之一同时使用时才会进行。指定选项'--print'并不会进行检查。

--[no]check-master
默认值:yes
指定当选项'--sync-to-master'使用时,尝试验证工具连接到的主库是否是真正的主库。

--[no]check-slave
默认值:yes
指定检查目标服务器是否是从库所在服务器。
如果目标服务器是从库,则对其进行变更是不安全的,但某些情况却必须这么做,比如当主库需要同步的表上没有唯一索引时,指定选项'--replace'是不会进行工作的,所以在这种情况下无法对主库进行变更。默认情况下如果需要对从库上进行变更,则工具会有提示,可以指定选项'--no-check-slave'禁止检查。

--[no]check-triggers
默认值:yes
指定检查目标表是否未定义触发器。

--chunk-index
指定使用哪个索引对表进行chunk分块操作。默认情况下会选择最优的索引,工具会在sql语句中添加force index子句。

--chunk-size
默认值:1000
指定表分块的chunk大小,每个chunk对应的表行数,也可以是数据块大小,当指定大小时允许的后缀单位为k、m、g。

--chunk-column
指定根据表中字段对表进行chunk操作。

--host,-h
指定连接的数据库ip地址。

--port,-p
指定连接的数据库port端口。

--user,-u
指定连接的数据库用户。

--password,-p
指定连接的数据库用户密码。

--socket,-s
指定使用socket文件连接。

--databases,-d
指定需要进行同步的数据库,如有多个则用','(逗号)隔开。

--tables,-t
指定仅需要进行同步的表,如有多个则用','(逗号)隔开。表名称可以使用数据库名加以限定。

--columns,-c
指定进行比较的表字段,如有多个则用','(逗号)隔开。

--where
通过where语句条件限制表的同步内容。

--dry-run
分析、选择同步的算法,并打印信息和退出。
意味着指定选项'--verbose'可以得出工具分析的结果。分析结果的输出格式与工具实际执行时的输出一致,但是并不会有数据被影响。

--engines,-e
指定仅同步对应存储引擎的表。

--execute
指定工具执行同步操作使表数据达成一致状态。
工具使用此选项意味着将同步指定出现数据不一致的表,因此表的数据将被更改,除非指定了选项'--verbose',否则表数据的更改将以静默的方式进行。

--explain-hosts
指定打印工具的连接信息和选项信息并退出执行。

--[no]foreign-key-checks
默认值:yes
指定进行外键约束检查,相当于执行set foreign_key_checks=1。如果指定'--on-foreign-key-checks',则对应执行set foreign_key_checks=0。

--[no]unique-checks
默认值:yes
指定唯一键约束检查,相当于执行set unique_checks=1。如果指定'--on-unique-check',则对就执行set unique_checks=0。

--function
默认值:crc32
指定校验操作使用的哈希函数。可选函数有sha1、md5等。

--ignore-columns
指定需要忽略比较的字段,如有多个则用','(逗号)隔开。

--ignore-databases
指定需要忽略比较的数据库,如有多个则用','(逗号)隔开,系统数据库information_schema和performance_schema默认被忽略。

--ignore-engines
默认值:federated,mrg_myisam
指定需要忽略同步的存储引擎类型的表,如有多个则用','(逗号)隔开。

--ignore-tables
指定需要忽略同步的表,如有多个则用','(逗号)隔开。表名称可以使用数据库名加以限定。

--ignore-tables-regex
指定采用正则表达式匹配忽略同步的表。

--[no]index-hint
默认值:yes
指定为查询表chunk对应的行添加索引提示(force/use index)。

--lock
指定哪个过程中进行锁表(lock tables)操作,主要有如下取值:
'
value  meaning
=====  ===========================================================================
0      永远不进行锁表操作;
1      每个同步周期进行锁表操作,例如锁定每次同步chunk对就的表行,这是最细粒度的锁定级别;
2      在表执行操作的时候进行锁表操作;
3      为连接的每个dsn连接的服务器进行锁表操作,指定语句flush tables with read lock。
'
当指定选项'--replicate'或'--sync-to-master'时,从库的表是不会被锁定的。如果指定了选项'--wait',则主库对应的表被锁定,工具暂定执行操作直到从库追上主库才继续执行。
如果指定选项'--transaction',则锁表操作(lock tables)不会执行,取代的方式是通过事务的开始和提交来进行锁定操作,例外情况是'--lock=3',如果指定选项'--no-transaction',则锁表操作(lock tables)适应所有'--lock'取值情况。

--lock-and-rename
指定锁定源表和目标表,执行同步操作,然后进行表名交换。这类似于一次轻量型的alter table操作,它需要两个dsn来连接并假设都在同一服务器上,选项使用的是lock tables语句对表进行锁定。

--print
指定打印工具需要执行哪些查询语句来同步表,解决数据不一致,只是打印输出,并不会真正执行。

--recursion-method
默认值:processlist,hosts
指定获取从库的方式。
'
method       uses
===========  =============================================
processlist  show processlist   
hosts        show slave hosts   
none         do not find slaves
==========================================================
'
processlist:通过show processlist方式找到slave,为默认方式,当show slave hosts不可用时。一旦实例运行在非3306端口上时,hosts方式就会变为默认方式;
hosts:通过show slave hosts方式找到slave,hosts方式要求从库配置'--report_host'和'--report_port'这两个参数。

--replace
指定所有的insert和update语句改写为replace语句。如果数据有违反唯一性约束,则工具会自动进行改写。

--replicate
指定参照该选项中列出的表进行表同步操作。
工具将在该选项指定的表中去查询数据不一致表的信息并进行同步操作,这个选项跟工具pt-table-checksum当中的同名选项是相同意义的。该选项会自动设置选项'--wait=60'并确保在主库进行变更。
如果指定选项'--sync-to-master',则工具会假设指定的连接是从库,并会寻找主库连接进行表数据同步操作,如果指定的连接不是从库,工具将使用选项'--recursion-method'中查找从库方法进行查找操作,然后再找到需要进行同步操作的表。

--set-vars
默认:
    wait_timeout=10000
    innodb_lock_wait_timeout=1
    lock_wait_timeout=60
运行检查时指定参数值,如有多个用','(逗号)分隔。如'--set-vars=wait_timeout=5000'。

--sync-to-master
指定将dsn连接信息确认为从库,并同步信息到主库。
该选项将指定的服务器当作是从库,并且检查从库的主库,连接主库。将主库作为数据同步的源端,从库作为数据同步的目标端进行同步。选项会默认设置选项'--wait=60'和'--lock=1',并且设置选项'--no-transaction'。

--timeout-ok
指定当选项'--wait'导致工具执行失败时跳过失败继续执行。
如果指定了选项'--wait',但是从库在指定时间内还是没能追上主库且依然存在主从延迟,则工具将中止操作并退出。指定选项'--timeout-ok'则会继续执行操作。

--[no]transaction
指定工具操作使用事务代替lock tables语句进行锁表。
事务开始和提交的锁粒度由选项'--lock'控制,这是默认的状态,但是选项'--lock'默认是关闭的,所以并不会生效。大多数选项如果指定锁定则默认也会禁止使用事务方式,如果想使用基于事务的锁定(如通过语句lock in share mode或for update),则需要显式指定选项'--transaction'。如果选项'--transaction'没有显式指定,则工具根据表类型来决定是基于事务锁定还是使用语句lock tables进行锁定,默认情况是innodb表使用事务,而其他类型表使用lock tables。如果指定了选项'--no-transaction',则工具在执行过程中都不会开启事务(即使操作的innodb引擎的表),表的锁定由选项'--lock'控制。
无论是显式指定该选项或者是隐式触发该选项,则都会开启隔离级别为repeatable read的一致性快照事务(with consistent snapshot)。

--verbose,-v
指定打印更详细的操作信息。

--version
显示工具的版本并退出。

--[no]version-check
默认值:yes
检查percona toolkit、mysql和其他程序的最新版本。

--wait,-w
指定存在主从复制延迟时从库可以等待多长时间追上主库,如果超过时间依然存在延迟就中止退出(除非指定选项'--timeout-ok')。

dsn选项(dsn)

可以使用dsn方式来连接数据库,dsn选项为key=value方式,在等号的两侧不能有空格出现,并且区分大小写,多个选项之前以','(逗号)隔开,主要选项如下:

  • a
    指定字符集
  • d
    指定需要同步数据库
  • t
    指定需要同步的表
  • h
    指定要连接的host
  • p
    指定要连接的port
  • s
    指定连接所使用的socket文件(unix systems)
  • u
    指定连接的用户名
  • p
    指定连接的用户名密码

示例:
h=192.168.58.3,p=3306,d=employees,t=employees

--replicate选项说明

pt-table-sync工具使用起来有点复杂,它可以通过很多不同方式起作用,其中选项--replicate的使用对于工具至关重要,以下关于该选项的使用作进一步的说明。

该选项的使用逻辑如下:

  • 如果不指定--replicate选项,dsn选项中有涉及到表选项t,则只同步指定的表:
    • 如果dsn只有1个主机信息,并指定选项--sync-to-master
      • 如果dsn代表的是从库,工具也会连接它的主库并且同步;
      • 如果dsn代表的是主库,工具会报错找不到主库。
    • 如果dsn里大于1个主机信息:
      • 1个dsn主机是源端数据库(并不区分主库和从库),按顺序向之后dsn主机同步。如果第一个是dsn主机是从库的话会将从库的数据同步到主库;
      • 如果第1个dsn主机是主库,确保同步的表有唯一索引以便在主库执行replace变更操作,并指定选项--no-check-slave
  • 如果指定--replicate选项,证明已经存在保存数据差异结果的表(可以先使用工具pt-table-checksum进行校验):
    • 指定--sync-to-master选项:
      • 当这两个选项一起使用时,只允许有1个dsn主机,否则工具会报错退出。dsn代表的是从库。工具会连接它的主库,找出差异数据并进行同步修复。
    • 不指定--sync-to-master选项:
      • dsn代表的是主库。工具会找出所有从库并连接,找出差异数据并进行同步修复。
  • 其他情况,不指定选项--replicate--sync-to-master
    • 有多个dsn主机:
      • 通过--databases或者--ignore-databases等过滤选项找出指定数据库所有表数据的差异,以dsn第1个主机为主,并同步差异到dsn其余所有主机。

总结:

  1. 如果dsn只有1个主机信息,则必须指定选项--sync-to-master或者--replicate其中之一,否则报错;
  2. 如果有指定选项--replicate--sync-to-master,或者两者其中之一,参考以上使用逻辑;
  3. 如果dsn不只1个主机信息,并且都没有指定选项--replicate--sync-to-master,则以第1个主机为主,同时指定选项--no-check-slave,在其余主机上同步差异数据。

复制安全

对于主从数据库的复制环境来说,当出现数据不一致的情形,有时候需要判断哪一个库的数据才是最终确定的数据。但大部分情况都希望在主库执行想应的数据同步变更,这样可以同时将变更同步到从库,既修复了从库数据的不一致性,也保证了变更在从库上得到执行。这样的情况只有在主库上的表有唯一键(主键)时并执行replace语句时才会生效,否则replace语句就像普通的insert语句,会导致主库插入的数据重复。
如果表上具有唯一键(主键)时,对于主从复制架构来说,最理想的做法是指定选项--replicate--sync-to-master将同步需要执行的变更语句放在主库上执行,并将变更的操作通过主从复制传递给从库来执行。如果表上没有唯一键,则变更只好在从库进行,但前提需指定选项--no-check-slave
对于是主主复制架构来说,变更操作必须在目标端数据库进行,在变更的同时需要指定选项--no-bin-log,即变更的操作不写入binlog中,否则变更操作会反向复制到另一台主库中执行变更操作,造成数据的不一致。

使用限制

pt-table-sync工具指定选项--replicate--sync-to-master进行数据同步操作时会使用基于语句(binlog_format=statement)的方式进行,所以需确保执行操作的用户拥有super权限。

用法示例

环境与数据准备

mysql:5.7.24
master:192.168.58.3:3306
slave:192.168.58.5:3306

本文基于mysql官方示例数据库employeeexample databases进行测试。

创建测试表employees_ptsync:

-- 表employees_ptsync信息
mysql admin@192.168.58.3:employees> create table employees_ptsync as select * from employees;
query ok, 300024 rows affected
time: 2.244s
mysql admin@192.168.58.3:employees> show create table employees_ptsync;
+------------------+--------------------------------------+
| table            | create table                         |
+------------------+--------------------------------------+
| employees_ptsync | create table `employees_ptsync` (    |
|                  |   `emp_no` int(11) not null,         |
|                  |   `birth_date` date not null,        |
|                  |   `first_name` varchar(14) not null, |
|                  |   `last_name` varchar(16) not null,  |
|                  |   `gender` enum('m','f') not null,   |
|                  |   `hire_date` date not null          |
|                  | ) engine=innodb default charset=utf8 |
+------------------+--------------------------------------+
1 row in set
time: 0.025s

-- 从库更新部分数据,使得主从出现数据不一致
mysql admin@192.168.58.5:employees> set sql_log_bin = 0;
query ok, 0 rows affected
time: 0.002s

mysql admin@192.168.58.5:employees> update employees_ptsync set first_name = 'georgi_ptsync' where first_name = 'georgi';
query ok, 252 rows affected
time: 0.248s

mysql admin@192.168.58.5:employees> set sql_log_bin = 1;
query ok, 0 rows affected
time: 0.002s

只有1个dsn主机

  • 只指定选项--sync-to-master

因为只有1个dsn主机并且指定了选项--sync-to-master,则dsn主机对应为从库的连接串,先使用选项--dry-run查看执行信息。

# pt-table-sync h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --sync-to-master --transaction --verbose --dry-run
enter password for 192.168.58.5:

# note: --dry-run does not show if data needs to be synced because it
#       does not access, compare or sync data.  --dry-run only shows
#       the work that would be done.
# syncing a=utf8,p=3306,h=192.168.58.5,p=...,u=admin in dry-run mode, without accessing or comparing data
# delete replace insert update algorithm start    end      exit database.table
can't make changes on the master because no unique index exists at /usr/bin/pt-table-sync line 10857.  while doing employees.employees_ptsync on 192.168.58.5
#      0       0      0      0 0         14:41:09 14:41:09 1    employees.employees_ptsync

因为表employees_ptsync没有任何索引的信息,以上报错提示表没有唯一键,先为表添加主键并再次执行。

-- 添加主键
mysql admin@192.168.58.3:employees> alter table employees_ptsync add primary key(emp_no);
query ok, 0 rows affected
time: 2.537s

-- 再次执行
# pt-table-sync h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --sync-to-master --transaction --verbose --dry-run
enter password for 192.168.58.5:

# note: --dry-run does not show if data needs to be synced because it
#       does not access, compare or sync data.  --dry-run only shows
#       the work that would be done.
# syncing a=utf8,p=3306,h=192.168.58.5,p=...,u=admin in dry-run mode, without accessing or comparing data
# delete replace insert update algorithm start    end      exit database.table
#      0       0      0      0 chunk     14:42:55 14:42:55 0    employees.employees_ptsync

从以上输出信息可得知并无报错信息,但因为使用了选项--dry-run,所以工具并不会进行校验和同步操作。

将选项--dry-run换成选项--execute再次执行。

# pt-table-sync h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --sync-to-master --transaction --verbose --execute
enter password for 192.168.58.5:

# syncing a=utf8,p=3306,h=192.168.58.5,p=...,u=admin
# delete replace insert update algorithm start    end      exit database.table
#      0     252      0      0 chunk     14:44:18 14:44:28 2    employees.employees_ptsync

可以看出在replace字段变更了252行记录,跟之前构建从库的数据行数一致,可以查询从库刚才表更新数据的情况进行验证:

-- 查询之前变更表的数据量
mysql admin@192.168.58.5:employees> select count(*) from employees_ptsync where first_name = 'georgi_ptsync';
+----------+
| count(*) |
+----------+
| 0        |
+----------+
1 row in set
time: 0.197s

-- 可以再使用pt-table-checksum进行验证
# pt-table-checksum h=192.168.58.3,p=3306,u=admin --ask-pass --databases=employees --tables=employees_ptsync --no-check-binlog-format --recursion-method dsn=d=percona,t=dsns
enter mysql password:

checking if all tables can be checksummed ...
starting checksum ...
            ts errors  diffs     rows  diff_rows  chunks skipped    time table
04-09t14:47:09      0      0   300024          0       5       0   0.807 employees.employees_ptsync
  • 只指定选项--replicate

如果是只指定选项--replicate,则dsn主机对应的为主库的连接串,在这之前选项--replicate指定的表有保存之前数据不一致的校验结果,可以先通过工具pt-table-checksum进行校验,否则并不会进行同步变更修复。

-- 查询校验表percona.checksums信息
mysql admin@192.168.58.3:employees> select count(*) from percona.checksums;
+----------+
| count(*) |
+----------+
| 0        |
+----------+
1 row in set
time: 0.022s

-- 执行同步操作
# pt-table-sync h=192.168.58.3,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --replicate='percona.checksums' --transaction --verbose --execute
enter password for 192.168.58.3:

# syncing via replication a=utf8,p=3306,h=192.168.58.5,p=...,u=admin
# delete replace insert update algorithm start    end      exit database.table

-- 先使用pt-table-checksum校验
# pt-table-checksum h=192.168.58.3,p=3306,u=admin --ask-pass --databases=employees --tables=employees_ptsync --no-check-binlog-format --recursion-method dsn=d=percona,t=dsns
enter mysql password:

checking if all tables can be checksummed ...
starting checksum ...
            ts errors  diffs     rows  diff_rows  chunks skipped    time table
04-09t15:04:04      0      3   300024          0       5       0   0.766 employees.employees_ptsync

-- 再次执行同步操作
# pt-table-sync h=192.168.58.3,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --replicate='percona.checksums' --transaction --verbose --execute
enter password for 192.168.58.3:

# syncing via replication a=utf8,p=3306,h=192.168.58.5,p=...,u=admin
# delete replace insert update algorithm start    end      exit database.table
#      0       1      0      0 chunk     15:05:51 15:05:52 2    employees.employees_ptsync
#      0      93      0      0 chunk     15:05:52 15:05:55 2    employees.employees_ptsync
#      0     158      0      0 chunk     15:05:55 15:06:01 2    employees.employees_ptsync
  • 同时指定选项--sync-to-master--replicate

因为选项--sync-to-master出现,所以dsn主机对应的为从库的连接串,默认之前还是没有进行校验。

-- 执行同步操作
# pt-table-sync h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --replicate='percona.checksums' --sync-to-master --transaction --verbose --execute
enter password for 192.168.58.5:

# syncing via replication a=utf8,p=3306,h=192.168.58.5,p=...,u=admin
# delete replace insert update algorithm start    end      exit database.table

-- 还是需要进行pt-table-checksum进行校验
# pt-table-checksum h=192.168.58.3,p=3306,u=admin --ask-pass --databases=employees --tables=employees_ptsync --no-check-binlog-format --recursion-method dsn=d=percona,t=dsns
enter mysql password:

checking if all tables can be checksummed ...
starting checksum ...
            ts errors  diffs     rows  diff_rows  chunks skipped    time table
04-09t15:08:00      0      4   300024          0       6       0   0.926 employees.employees_ptsync

-- 再次执行同步操作
# pt-table-sync h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --replicate='percona.checksums' --sync-to-master --transaction --verbose --execute
enter password for 192.168.58.5:

# syncing via replication a=utf8,p=3306,h=192.168.58.5,p=...,u=admin
# delete replace insert update algorithm start    end      exit database.table
#      0       1      0      0 chunk     15:10:29 15:10:29 2    employees.employees_ptsync
#      0      28      0      0 chunk     15:10:29 15:10:30 2    employees.employees_ptsync
#      0     114      0      0 chunk     15:10:30 15:10:35 2    employees.employees_ptsync
#      0     109      0      0 chunk     15:10:35 15:10:40 2    employees.employees_ptsync
  • 不指定选项--sync-to-master--replicate

当dsn只有1个主机的时候,必须指定至少其中一个选项,否则工具报错退出。

# pt-table-sync h=192.168.58.3,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --transaction --verbose --execute
usage: pt-table-sync [options] dsn [dsn]

errors in command-line arguments:
  * at least one dsn is required, and at least two are required unless --sync-to-master or --replicate is specified

pt-table-sync synchronizes data efficiently between mysql tables.  for more
details, please use the --help option, or try 'perldoc /usr/bin/pt-table-sync'
for complete documentation.

有多个dsn主机

  • 只指定选项--sync-to-master

因为有多个dsn主机,必须确保所列出dsn主机均为从库,否则工具报错退出。

# pt-table-sync h=192.168.58.3,p=3306,u=admin h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --sync-to-master --transaction --verbose --execute
enter password for 192.168.58.3:

can't determine master of a=utf8,p=3306,h=192.168.58.3,p=...,u=admin at /usr/bin/pt-table-sync line 10020, <stdin> line 1.
  • 只指定选项--replicate

如果只指定选项--replicate,也必须之前做过校验操作。

-- 执行同步操作
# pt-table-sync h=192.168.58.3,p=3306,u=admin h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --replicate='percona.checksums' --transaction --verbose --execute
enter password for 192.168.58.3:
enter password for 192.168.58.5:

# syncing via replication a=utf8,p=3306,h=192.168.58.5,p=...,u=admin
# delete replace insert update algorithm start    end      exit database.table

-- 还是需要进行pt-table-checksum进行校验
# pt-table-checksum h=192.168.58.3,p=3306,u=admin --ask-pass --databases=employees --tables=employees_ptsync --no-check-binlog-format --recursion-method dsn=d=percona,t=dsns
enter mysql password:

checking if all tables can be checksummed ...
starting checksum ...
            ts errors  diffs     rows  diff_rows  chunks skipped    time table
04-09t15:15:46      0      3   300024          0       5       0   0.805 employees.employees_ptsync

-- 再次执行同步操作
# pt-table-sync h=192.168.58.3,p=3306,u=admin h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --replicate='percona.checksums' --transaction --verbose --execute
enter password for 192.168.58.3:
enter password for 192.168.58.5:

# syncing via replication a=utf8,p=3306,h=192.168.58.5,p=...,u=admin
# delete replace insert update algorithm start    end      exit database.table
#      0       1      0      0 chunk     15:15:53 15:15:53 2    employees.employees_ptsync
#      0      86      0      0 chunk     15:15:53 15:15:57 2    employees.employees_ptsync
#      0     165      0      0 chunk     15:15:57 15:16:03 2    employees.employees_ptsync
  • 同时指定选项--sync-to-master--replicate

当同时指定这两个选项时,dsn主机只允许有一个,否则工具报错退出。

# pt-table-sync h=192.168.58.3,p=3306,u=admin h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --replicate='percona.checksums' --sync-to-master --transaction --verbose --execute
usage: pt-table-sync [options] dsn [dsn]

errors in command-line arguments:
  * --sync-to-master and --replicate require only one dsn

pt-table-sync synchronizes data efficiently between mysql tables.  for more
details, please use the --help option, or try 'perldoc /usr/bin/pt-table-sync'
for complete documentation.
  • 不指定选项--sync-to-master--replicate

因为都不指定这两个选项,所以dsn主机的顺序必须格外注意,最好是先写主库再写从库,或者根据同步的方向来确定。同时如果需要做同步变更修复的表上没有唯一键(主键),最好都指定选项--no-check-slave直接在从库进行变更修复。

# pt-table-sync h=192.168.58.3,p=3306,u=admin h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --transaction --verbose --execute
enter password for 192.168.58.3:
enter password for 192.168.58.5:

# syncing a=utf8,p=3306,h=192.168.58.5,p=...,u=admin
# delete replace insert update algorithm start    end      exit database.table
can't make changes on a=utf8,p=3306,h=192.168.58.5,p=...,u=admin because it's a slave. see the documentation section 'replication safety' for solutions to this problem. at /usr/bin/pt-table-sync line 10878.  while doing employees.employees_ptsync on 192.168.58.5
#      0       0      0      0 0         15:19:19 15:19:19 1    employees.employees_ptsync

-- 加上选项--no-check-slave
# pt-table-sync h=192.168.58.3,p=3306,u=admin h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --no-check-slave --transaction --verbose --execute
enter password for 192.168.58.3:
enter password for 192.168.58.5:

# syncing a=utf8,p=3306,h=192.168.58.5,p=...,u=admin
# delete replace insert update algorithm start    end      exit database.table
#      0       0      0    252 chunk     15:20:45 15:20:52 2    employees.employees_ptsync

可以看出如果在从库进行变更修复,执行的是update操作。

输出说明

工具同步执行操作的输出解析如下:

字段名 说明
delete 删除的行数
replace 替换的行数
insert 插入的行数
update 更新的行数
algorithm 校验使用的算法
start 执行开始的时间
end 执行结束的时间
exit 退出状态码
database.table 涉及的数据库.表

关于退出状态码的说明如下:

status  meaning
======  ========================================================================================
0       工具没有执行同步变更操作并成功退出。(success)
1       工具出现内部错误。(internal error)
2       至少有一张表校验有不一致并进行同步变更修复。(at least one table differed on the destination)
3       状态1和状态2共同出现的情况。(combination of 1 and 2)

注意事项

  1. 只使用1个dsn主机信息,连接的主库,加上选项--replicate,需先进行校验,与pt-table-checksum工具配合使用;
  2. 只使用1个dsn主机信息,连接的从库,加上选项--sync-to-master,无需先进行校验;
  3. 使用多个dsn主机信息,按照数据同步方向,顺序写好主机信息,根据实际需求加上选项--no-check-slave
  4. 推荐使用多个dsn主机信息的方式,同时避免使用选项--replicate--sync-to-master,无需先进行校验,只需考虑数据同步的方向。

工作流程

因为dsn主机提供了不同的方式进行校验和同步修复方法,所以工作流程分为两种情况进行分析:

  1. 只使用1个dsn主机连接从库,只使用选项--sync-to-master
  2. 使用多个dsn主机同时连接主库和从库,只使用选项--replicate,需先使用工具pt-table-checksum校验。

还是通过general log记录操作来了解。

  • 第1种情形:

为了减少general log的篇幅,加上选项--chunk-size=50000

# pt-table-sync h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --sync-to-master --transaction --chunk-size=50000 --verbose --execute
-- 开启会话线程167进行初始的一些检查数据库参数、负载信息这里不再细说
167 connect admin@dbabd1 on  using tcp/ip
167 query   set autocommit=0
167 query   /*!40101 set names "utf8"*/
167 query   show variables like 'wait\_timeout'
167 query   set session wait_timeout=10000
167 query   select @@sql_mode
167 query   set @@sql_quote_show_create = 1/*!40101, @@sql_mode='no_auto_value_on_zero,only_full_group_by,strict_trans_tables,no_zero_in_date,no_zero_date,error_for_division_by_zero,no_auto_create_user,no_engine_substitution'*/
167 query   /*!40101 set @@sql_mode := concat(@@sql_mode, ',no_auto_value_on_zero')*/
167 query   show variables like 'version%'
167 query   show engines
167 query   show variables like 'innodb_version'

-- 设置binlog_format=statement
167 query   select @@binlog_format
167 query   /*!50108 set @@binlog_format := 'statement'*/

-- 设置会话级隔离级别为repeatable read
167 query   set session transaction isolation level repeatable read
167 query   show master status

-- 查询当前连接用户的权限
167 query   show grants for current_user()
167 query   show full processlist
167 query   show variables like 'port'
167 query   select concat(@@hostname, @@port)

-- 开启别一个会话线程168持续检查状态
168 connect admin@dbabd1 on  using tcp/ip
168 query   set autocommit=0
168 query   /*!40101 set names "utf8"*/
168 query   show variables like 'wait\_timeout'
168 query   set session wait_timeout=10000
168 query   select @@sql_mode
168 query   set @@sql_quote_show_create = 1/*!40101, @@sql_mode='no_auto_value_on_zero,only_full_group_by,strict_trans_tables,no_zero_in_date,no_zero_date,error_for_division_by_zero,no_auto_create_user,no_engine_substitution'*/
168 query   /*!40101 set @@sql_mode := concat(@@sql_mode, ',no_auto_value_on_zero')*/
168 query   show variables like 'version%'
168 query   show engines
168 query   show variables like 'innodb_version'
168 query   select @@binlog_format
168 query   /*!50108 set @@binlog_format := 'statement'*/
168 query   set session transaction isolation level repeatable read

-- 会话线程167查询当前数据库和需要操作表的状态信息,表结构信息等,记录开始时间
167 query   show databases
167 query   show /*!50002 full*/ tables from `employees`
167 query   /*!40101 set @old_sql_mode := @@sql_mode, @@sql_mode := '', @old_quote := @@sql_quote_show_create, @@sql_quote_show_create := 1 */
167 query   use `employees`
167 query   show create table `employees`.`employees_ptsync`
167 query   /*!40101 set @@sql_mode := @old_sql_mode, @@sql_quote_show_create := @old_quote */
167 query   select now()

-- 查询需要操作表是否被外键约束
167 query   select table_schema, table_name from information_schema.key_column_usage where constraint_schema='employees' and referenced_table_name='employees_ptsync'
167 query   set names 'utf8'

-- 确定需要操作表下边界和上边界值,依赖主键(唯一键)
167 query   select min(`emp_no`), max(`emp_no`) from `employees`.`employees_ptsync` force index (`primary`)
167 query   explain select * from `employees`.`employees_ptsync` force index (`primary`)
167 query   select crc32('test-string')
167 query   select crc32('a')
167 query   select crc32('a')

-- 开启执行校验,并同步进行不一致的同步修复,每执行一次chunk校验和变更都开启了一致性快照事务
167 query   use `employees`
167 query   set @crc := '', @cnt := 0
167 query   commit
167 query   start transaction /*!40108 with consistent snapshot */
167 query   select /*employees.employees_ptsync:1/7*/ 0 as chunk_num, count(*) as cnt, coalesce(lower(conv(bit_xor(cast(crc32(concat_ws('#', `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`)) as unsigned)), 10, 16)), 0) as crc from `employees`.`employees_ptsync` force index (`primary`) where (`emp_no` = 0) for update
168 query   show master status
167 query   set @crc := '', @cnt := 0
167 query   commit
167 query   start transaction /*!40108 with consistent snapshot */
167 query   select /*employees.employees_ptsync:2/7*/ 1 as chunk_num, count(*) as cnt, coalesce(lower(conv(bit_xor(cast(crc32(concat_ws('#', `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`)) as unsigned)), 10, 16)), 0) as crc from `employees`.`employees_ptsync` force index (`primary`) where (`emp_no` > 0 and `emp_no` < '91801') for update
168 query   show master status
167 query   set @crc := '', @cnt := 0
167 query   select /*rows in chunk*/ `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`, crc32(concat_ws('#', `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`)) as __crc from `employees`.`employees_ptsync` force index (`primary`) where (`emp_no` > 0 and `emp_no` < '91801') order by `emp_no` for update
167 query   select `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date` from `employees`.`employees_ptsync` where `emp_no`='10909' limit 1
167 query   replace into `employees`.`employees_ptsync`(`emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`) values ('10909', '1954-11-11', 'georgi', 'atchley', 'm', '1985-04-21') /*percona-toolkit src_db:employees src_tbl:employees_ptsync src_dsn:a=utf8,p=3306,h=192.168.58.3,p=...,u=admin dst_db:employees dst_tbl:employees_ptsync dst_dsn:a=utf8,p=3306,h=192.168.58.5,p=...,u=admin lock:1 transaction:1 changing_src:1 replicate:0 bidirectional:0 pid:18953 user:root host:dbabd*/
167 query   select `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date` from `employees`.`employees_ptsync` where `emp_no`='11029' limit 1
167 query   replace into `employees`.`employees_ptsync`(`emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`) values ('11029', '1962-07-12', 'georgi', 'itzfeldt', 'm', '1992-12-27') /*percona-toolkit src_db:employees src_tbl:employees_ptsync src_dsn:a=utf8,p=3306,h=192.168.58.3,p=...,u=admin dst_db:employees dst_tbl:employees_ptsync dst_dsn:a=utf8,p=3306,h=192.168.58.5,p=...,u=admin lock:1 transaction:1 changing_src:1 replicate:0 bidirectional:0 pid:18953 user:root host:dbabd*/

……省略……

-- 直到最后一个chunk校验完并进行修复,可以看出在校验过程中为这些加了行锁,使用语句for update
167 query   start transaction /*!40108 with consistent snapshot */
167 query   select /*employees.employees_ptsync:7/7*/ 6 as chunk_num, count(*) as cnt, coalesce(lower(conv(bit_xor(cast(crc32(concat_ws('#', `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`)) as unsigned)), 10, 16)), 0) as crc from `employees`.`employees_ptsync` force index (`primary`) where (`emp_no` >= '419001') for update
168 query   show master status
167 query   set @crc := '', @cnt := 0
167 query   select /*rows in chunk*/ `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`, crc32(concat_ws('#', `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`)) as __crc from `employees`.`employees_ptsync` force index (`primary`) where (`emp_no` >= '419001') order by `emp_no` for update
167 query   select `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date` from `employees`.`employees_ptsync` where `emp_no`='420266' limit 1
167 query   replace into `employees`.`employees_ptsync`(`emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`) values ('420266', '1955-03-30', 'georgi', 'armand', 'm', '1998-06-13') /*percona-toolkit src_db:employees src_tbl:employees_ptsync src_dsn:a=utf8,p=3306,h=192.168.58.3,p=...,u=admin dst_db:employees dst_tbl:employees_ptsync dst_dsn:a=utf8,p=3306,h=192.168.58.5,p=...,u=admin lock:1 transaction:1 changing_src:1 replicate:0 bidirectional:0 pid:18953 user:root host:dbabd*/
167 query   select `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date` from `employees`.`employees_ptsync` where `emp_no`='420295' limit 1
167 query   commit

-- 记录结束时间,并退出
167 query   select now()
167 query   commit
167 quit    
168 query   commit
168 quit

流程总结:

  1. 开启两个会话连接,一个会话负责校验同步,一个会话负责持续检查服务器状态信息;
  2. 连接dsn主机对应的主库,检查当前服务器负载信息,参数设置信息,关闭自动提交功能;
  3. 设置二进制日志格式为statement,设置会话级别隔离级别为repeatable read
  4. 检查当前连接用户的权限,检查操作表是否被外键约束;
  5. 通过主键或唯一键(如有)对表进行chunk上边界和下边界的确定,以便更好进行chunk分块操作;
  6. 表被分成多个chunk进行校验和同步修复,chunk大小由选项--chunk-size控制;
  7. 完成所有的chunk校验和同步修复,退出。
  • 第2种情形

需要先进行pt-table-checksum校验操作,这里不再说明。

pt-table-sync h=192.168.58.3,p=3306,u=admin h=192.168.58.5,p=3306,u=admin --charset=utf8 --ask-pass --databases=employees --tables=employees_ptsync --replicate='percona.checksums' --transaction --chunk-size=50000 --verbose --execute
-- 开启会话线程186进行初始的一些检查数据库参数、负载信息这里不再细说
186 connect admin@dbabd1 on  using tcp/ip
186 query   set autocommit=0
186 query   /*!40101 set names "utf8"*/
186 query   show variables like 'wait\_timeout'
186 query   set session wait_timeout=10000
186 query   select @@sql_mode
186 query   set @@sql_quote_show_create = 1/*!40101, @@sql_mode='no_auto_value_on_zero,only_full_group_by,strict_trans_tables,no_zero_in_date,no_zero_date,error_for_division_by_zero,no_auto_create_user,no_engine_substitution'*/
186 query   /*!40101 set @@sql_mode := concat(@@sql_mode, ',no_auto_value_on_zero')*/
186 query   show variables like 'version%'
186 query   show engines
186 query   show variables like 'innodb_version'

-- 设置binlog_format=statement
186 query   select @@binlog_format
186 query   /*!50108 set @@binlog_format := 'statement'*/

-- 设置会话级隔离级别为repeatable read
186 query   set session transaction isolation level repeatable read

-- 开启别一个会话线程187持续检查状态
187 connect admin@dbabd1 on  using tcp/ip
187 query   set autocommit=0
187 query   /*!40101 set names "utf8"*/
187 query   show variables like 'wait\_timeout'
187 query   set session wait_timeout=10000
187 query   select @@sql_mode
187 query   set @@sql_quote_show_create = 1/*!40101, @@sql_mode='no_auto_value_on_zero,only_full_group_by,strict_trans_tables,no_zero_in_date,no_zero_date,error_for_division_by_zero,no_auto_create_user,no_engine_substitution'*/
187 query   /*!40101 set @@sql_mode := concat(@@sql_mode, ',no_auto_value_on_zero')*/
187 query   show variables like 'version%'
187 query   show engines
187 query   show variables like 'innodb_version'
187 query   select @@binlog_format
187 query   /*!50108 set @@binlog_format := 'statement'*/
187 query   set session transaction isolation level repeatable read

-- 会话线程186查询选项--replicate指定表确定不一致的信息,包括表chunk信息等
186 query   select @@server_id
186 query   select db, tbl, concat(db, '.', tbl) as `table`, chunk, chunk_index, lower_boundary, upper_boundary, coalesce(this_cnt-master_cnt, 0) as cnt_diff, coalesce(this_crc <> master_crc or isnull(master_crc) <> isnull(this_crc), 0) as crc_diff, this_cnt, master_cnt, this_crc, master_crc from percona.checksums where master_cnt <> this_cnt or master_crc <> this_crc or isnull(master_crc) <> isnull(this_crc)

-- 查询当前连接用户的权限,记录开始时间,表结构信息等,检查是否存在外键约束
186 query   show grants for current_user()
186 query   show full processlist
186 query   select now()
186 query   /*!40101 set @old_sql_mode := @@sql_mode, @@sql_mode := '', @old_quote := @@sql_quote_show_create, @@sql_quote_show_create := 1 */
186 query   use `employees`
186 query   show create table `employees`.`employees_ptsync`
186 query   /*!40101 set @@sql_mode := @old_sql_mode, @@sql_quote_show_create := @old_quote */
186 query   select table_schema, table_name from information_schema.key_column_usage where constraint_schema='employees' and referenced_table_name='employees_ptsync'
186 query   set names 'utf8'

187 query   set names 'utf8'

-- 确定首个chunk需要操作表下边界和上边界值,依赖主键(唯一键)
186 query   select min(`emp_no`), max(`emp_no`) from `employees`.`employees_ptsync` force index (`primary`) where (((`emp_no` >= '10001')) and ((`emp_no` <= '11000')))
186 query   explain select * from `employees`.`employees_ptsync` force index (`primary`) where ((`emp_no` >= '10001')) and ((`emp_no` <= '11000'))
186 query   select crc32('test-string')
186 query   select crc32('a')
186 query   select crc32('a')

-- 获取chunk中表行数据进行校验,并同步进行不一致的同步修复,每执行一次chunk校验和变更都开启了一致性快照事务
186 query   use `employees`
186 query   set @crc := '', @cnt := 0
186 query   commit
186 query   start transaction /*!40108 with consistent snapshot */
186 query   select /*employees.employees_ptsync:1/4*/ 0 as chunk_num, count(*) as cnt, coalesce(lower(conv(bit_xor(cast(crc32(concat_ws('#', `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`)) as unsigned)), 10, 16)), 0) as crc from `employees`.`employees_ptsync` force index (`primary`) where (`emp_no` = 0) and ((((`emp_no` >= '11001')) and ((`emp_no` <= '242216')))) for update
187 query   show master status
186 query   set @crc := '', @cnt := 0
186 query   commit
186 query   start transaction /*!40108 with consistent snapshot */
186 query   select /*employees.employees_ptsync:2/4*/ 1 as chunk_num, count(*) as cnt, coalesce(lower(conv(bit_xor(cast(crc32(concat_ws('#', `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`)) as unsigned)), 10, 16)), 0) as crc from `employees`.`employees_ptsync` force index (`primary`) where (`emp_no` > 0 and `emp_no` < '88199') and ((((`emp_no` >= '11001')) and ((`emp_no` <= '242216')))) for update
187 query   show master status
186 query   set @crc := '', @cnt := 0
186 query   select /*rows in chunk*/ `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`, crc32(concat_ws('#', `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`)) as __crc from `employees`.`employees_ptsync` force index (`primary`) where (`emp_no` > 0 and `emp_no` < '88199') and (((`emp_no` >= '11001')) and ((`emp_no` <= '242216'))) order by `emp_no` for update
186 query   select `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date` from `employees`.`employees_ptsync` where `emp_no`='11029' limit 1
186 query   replace into `employees`.`employees_ptsync`(`emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`) values ('11029', '1962-07-12', 'georgi', 'itzfeldt', 'm', '1992-12-27') /*percona-toolkit src_db:employees src_tbl:employees_ptsync src_dsn:a=utf8,p=3306,h=192.168.58.3,p=...,u=admin dst_db:employees dst_tbl:employees_ptsync dst_dsn:a=utf8,p=3306,h=192.168.58.5,p=...,u=admin lock:1 transaction:1 changing_src:percona.checksums replicate:percona.checksums bidirectional:0 pid:26323 user:root host:dbabd*/
186 query   select `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date` from `employees`.`employees_ptsync` where `emp_no`='11430' limit 1
186 query   replace into `employees`.`employees_ptsync`(`emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`) values ('11430', '1957-01-23', 'georgi', 'klassen', 'm', '1996-02-27') /*percona-toolkit src_db:employees src_tbl:employees_ptsync src_dsn:a=utf8,p=3306,h=192.168.58.3,p=...,u=admin dst_db:employees dst_tbl:employees_ptsync dst_dsn:a=utf8,p=3306,h=192.168.58.5,p=...,u=admin lock:1 transaction:1 changing_src:percona.checksums replicate:percona.checksums bidirectional:0 pid:26323 user:root host:dbabd*/

……省略……

-- 首个chunk执行结束,记录结束时间
186 query   select `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date` from `employees`.`employees_ptsync` where `emp_no`='239542' limit 1
186 query   replace into `employees`.`employees_ptsync`(`emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`) values ('239542', '1957-06-20', 'georgi', 'barriga', 'f', '1994-04-28') /*percona-toolkit src_db:employees src_tbl:employees_ptsync src_dsn:a=utf8,p=3306,h=192.168.58.3,p=...,u=admin dst_db:employees dst_tbl:employees_ptsync dst_dsn:a=utf8,p=3306,h=192.168.58.5,p=...,u=admin lock:1 transaction:1 changing_src:percona.checksums replicate:percona.checksums bidirectional:0 pid:26323 user:root host:dbabd*/
186 query   commit
186 query   select now()

-- 确定接下去chunk需要操作表下边界和上边界值,依赖主键(唯一键)
186 query   select now()
186 query   select table_schema, table_name from information_schema.key_column_usage where constraint_schema='employees' and referenced_table_name='employees_ptsync'
186 query   set names 'utf8'
187 query   set names 'utf8'
186 query   select min(`emp_no`), max(`emp_no`) from `employees`.`employees_ptsync` force index (`primary`) where (((`emp_no` >= '242217')) and ((`emp_no` <= '499999')))
186 query   explain select * from `employees`.`employees_ptsync` force index (`primary`) where ((`emp_no` >= '242217')) and ((`emp_no` <= '499999'))
186 query   select crc32('test-string')
186 query   select crc32('a')
186 query   select crc32('a')

……省略……

-- 完成最后chunk的校验并进行不一致的同步修复
186 query   select `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date` from `employees`.`employees_ptsync` where `emp_no`='498809' limit 1
186 query   replace into `employees`.`employees_ptsync`(`emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`) values ('498809', '1961-10-24', 'georgi', 'ferriere', 'm', '1993-02-21') /*percona-toolkit src_db:employees src_tbl:employees_ptsync src_dsn:a=utf8,p=3306,h=192.168.58.3,p=...,u=admin dst_db:employees dst_tbl:employees_ptsync dst_dsn:a=utf8,p=3306,h=192.168.58.5,p=...,u=admin lock:1 transaction:1 changing_src:percona.checksums replicate:percona.checksums bidirectional:0 pid:26323 user:root host:dbabd*/
186 query   select `emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date` from `employees`.`employees_ptsync` where `emp_no`='499814' limit 1
186 query   replace into `employees`.`employees_ptsync`(`emp_no`, `birth_date`, `first_name`, `last_name`, `gender`, `hire_date`) values ('499814', '1960-12-28', 'georgi', 'wielonsky', 'm', '1989-01-31') /*percona-toolkit src_db:employees src_tbl:employees_ptsync src_dsn:a=utf8,p=3306,h=192.168.58.3,p=...,u=admin dst_db:employees dst_tbl:employees_ptsync dst_dsn:a=utf8,p=3306,h=192.168.58.5,p=...,u=admin lock:1 transaction:1 changing_src:percona.checksums replicate:percona.checksums bidirectional:0 pid:26323 user:root host:dbabd*/
186 query   commit

-- 记录结束时间,并退出
186 query   select now()
186 query   commit
186 quit    
187 query   commit
187 quit    

工作流程与第1种情形类似,只不过在处理chunk时使用的是选项--replicate指定表中的记录情况,而不是实时进行chunk处理,其他操作流程与第1种情形一致。

总结

pt-table-sync工具作为一款高效的数据同步工具,通常与pt-table-checksum工具一起使用,但是它涉及到数据的更改,在使用时最好先进行测试之后再对线上服务器进行操作,虽然对生产服务器的性能影响服务较小,但是在进行校验分析的同时会对操作的表行执行for update语句进行锁定,所以尽量选择在业务低峰期进行操作,同时避免在高并发场景下进行操作数据以免造成阻塞。

本文只说明了pt-table-sync工具的单向同步方式,其实它也支持双向同步,只是有许多限制条件并且也处在一个测试功能的阶段,更多关于pt-table-sync的说明可以参考官方说明:pt-table-sync

参考

https://www.percona.com/doc/percona-toolkit/latest/pt-table-sync.html

☆〖本人水平有限,文中如有错误还请留言批评指正!〗☆