MySQL复制问题的三个参数分析

程序员文章站 2022-03-13 08:19:00

今天星期二，早上居然起晚了，上班迟到了，简直是。。。废话不多说，在昨天的文章中，我们提到了三个参数，分别是： slave_exec_mode参数； sql_slave_skip_counter=n...

今天星期二，早上居然起晚了，上班迟到了，简直是。。。废话不多说，在昨天的文章中，我们提到了三个参数，分别是：

slave_exec_mode参数；
sql_slave_skip_counter=n参数;
slave-skip-errors=n参数。

这三个参数都可以解决并行复制中的一些指定的错误，例如duplicate key 1062错误等，今天我们简单试验一下，这三个参数的区别：

01 sql_slave_skip_counter参数

这个参数的设置主要是为了跳过某些错误的"event",注意这里的用词是event而不是事务，是因为它的本质是跳过一个一个事件，需要注意的是，这个参数需要在偏移量复制模式中使用，如果使用的是gtid的复制模式，则不可以使用这个参数。我们来看例子，首先搭建一套复制关系：

master 10.30.124.68

slave 10.30.124.128

这俩实例互为主从。我们创建测试表test.yeyz，并插入一些数据，其中id为主键，具有唯一性，如下：

master上

mysql:(none) 22:25:56>>select * from test.yeyz;
+----+------+
| id | age  |
+----+------+
|  1 |    1 |
|  2 |    2 |
|  3 |    3 |
|  4 |    4 |
+----+------+
4 rows in set (0.00 sec)

slave上

mysql:(none) 22:25:38>>select * from test.yeyz;
+----+------+
| id | age  |
+----+------+
|  1 |    1 |
|  2 |    2 |
|  3 |    3 |
|  4 |    4 |
|  5 |    5 |
+----+------+
5 rows in set (0.00 sec)

我们可以发现，从节点的数据比主节点多一条，多了id=5的记录，然后我们在主节点上插入数据：

mysql:(none) 22:26:06>>insert into test.yeyz values (5,5),(6,6);
query ok, 2 rows affected (0.00 sec)
records: 2  duplicates: 0  warnings: 0

此时观察从节点：

mysql:(none) 22:26:34>>show slave status\g
                  master_host: 10.30.124.68
                  master_user: dba_repl
                  master_port: 4306
                connect_retry: 60
              master_log_file: mysqlbin.000002
          read_master_log_pos: 523
               relay_log_file: slave-relay-bin.000002
                relay_log_pos: 319
        relay_master_log_file: mysqlbin.000002
             slave_io_running: yes
            slave_sql_running: no
                   last_errno: 1062
                   last_error: coordinator stopped because there were error(s) 
in the worker(s). the most recent failure being:
 worker 0 failed executing transaction 'anonymous' at
 master log mysqlbin.000002, end_log_pos 492.
 see error log and/or performance_schema.replication_applier_status_by_worker
 table for more details about this failure or others, if any.
                 skip_counter: 0

可以发现，从节点已经sql线程断开了，这个时候，在主节点上查询这个错误position 492处的binlog，可以看到：

mysql:(none) 22:30:28>>show binlog events in 'mysqlbin.000002' from 194;  
+-----------------+-----+----------------+-----------+-------------+--------------------------------------------+
| log_name        | pos | event_type     | server_id | end_log_pos | info                                       |
+-----------------+-----+----------------+-----------+-------------+--------------------------------------------+
| mysqlbin.000002 | 194 | anonymous_gtid |       192 |         259 | set @@session.gtid_next= 'anonymous'       |
| mysqlbin.000002 | 259 | query          |       192 |         327 | begin                                      |
| mysqlbin.000002 | 327 | rows_query     |       192 |         391 | # insert into test.yeyz values (5,5),(6,6) |
| mysqlbin.000002 | 391 | table_map      |       192 |         439 | table_id: 108 (test.yeyz)                  |
| mysqlbin.000002 | 439 | write_rows     |       192 |         492 | table_id: 108 flags: stmt_end_f            |
| mysqlbin.000002 | 492 | xid            |       192 |         523 | commit /* xid=38 */                        |
+-----------------+-----+----------------+-----------+-------------+--------------------------------------------+
6 rows in set (0.00 sec)

从上面的binlog可以看出来，我们的一个insert操作实际上生成了5个enent，分别对应的pos是从259~492，关于event，待会儿再说。

因为主节点上插入了id=5的记录，跟从节点上的记录冲突了，查看错误日志，可以发现：

duplicate entry '5' for key 'primary',
 error_code: 1062; handler error ha_err_found_dupp_key; 
the event's master log first, 
end_log_pos 492 | 2019-07-16 22:26:25

我们通过sql_slave_skip_counter参数的设置来解决这个问题，步骤如下：

mysql:(none) 22:29:32>>stop slave;
query ok, 0 rows affected, 1 warning (0.00 sec)

mysql:(none) 22:32:45>>set global sql_slave_skip_counter=1;
query ok, 0 rows affected (0.00 sec)

mysql:(none) 22:33:06>>start slave;

在昨天的文章中我们说过，sql_slave_skip_counter后面跟的值是event的个数，所以这里我们相当于跳过了一个event，mysql中规定，如果跳过一个event之后，还在某一个事务里面，那么会继续跳过这个事务。

使用这个参数跳过一个event之后，我们再来看从库表中的数据和复制情况，可以看到：

slave表：

mysql:(none) 22:33:10>>show slave status\g
*************************** 1. row ***************************
               slave_io_state: waiting for master to send event
                  master_host: 10.30.124.68
                  master_user: dba_repl
                  master_port: 4306
                connect_retry: 60
              master_log_file: mysqlbin.000002
          read_master_log_pos: 523
               relay_log_file: slave-relay-bin.000003
                relay_log_pos: 319
        relay_master_log_file: mysqlbin.000002
             slave_io_running: yes
            slave_sql_running: yes


mysql:(none) 22:33:16>>select * from test.yeyz;
+----+------+
| id | age  |
+----+------+
|  1 |    1 |
|  2 |    2 |
|  3 |    3 |
|  4 |    4 |
|  5 |    5 |
+----+------+
5 rows in set (0.00 sec)

看看master表：

mysql:(none) 22:33:36>>select * from test.yeyz;
+----+------+
| id | age  |
+----+------+
|  1 |    1 |
|  2 |    2 |
|  3 |    3 |
|  4 |    4 |
|  5 |    5 |
|  6 |    6 |
+----+------+
6 rows in set (0.00 sec)

可以发现，master中数据插入成功，而slave中数据插入失败，也就是说：

该参数跳过错误的时候，会导致主从的数据不一致。

02 slave_skip_errors参数

这个参数是跳过制定的错误，也就是说，需要我们设置对应的error_code，从下面的日志中的内容可以看出，error_code的值为1062

duplicate entry '5' for key 'primary',
 error_code: 1062; handler error ha_err_found_dupp_key; 
the event's master log first, 
end_log_pos 492 | 2019-07-16 22:26:25

我们需要手动将这个参数的值也该为1062，需要注意的是，这个参数的改动需要重启mysql服务，因为这个参数是一个只读的参数。

修改后的情况如下：

mysql--dba_admin@127.0.0.1:(none) 22:38:55>>show variables like '%errors%';
+--------------------+---------+
| variable_name      | value   |
+--------------------+---------+
| max_connect_errors | 1000000 |
| slave_skip_errors  | 1062    |
+--------------------+---------+
2 rows in set (0.01 sec)

此时我们更新master表和slave表的数据，更新后的情况如下：

master：

mysql:(none) 22:39:15>>select * from test.yeyz;
+----+------+
| id | age  |
+----+------+
|  1 |    1 ||  2 |    2 |
|  3 |    3 ||  4 |    4 |
|  5 |    5 ||  6 |    6 |
+----+------+
6 rows in set (0.00 sec)

slave上：

mysql:(none) 22:40:15>>select * from test.yeyz;
+----+------+
| id | age  |
+----+------+
|  1 |    1 |
|  2 |    2 |
|  3 |    3 |
|  4 |    4 |
|  5 |    5 |
|  6 |    6 |
|  7 |    7 |
+----+------+
7 rows in set (0.00 sec)

我们发现，slave表比master表多一条数据，也就是id=7的记录，此时我们在master上执行：

mysql:(none) 22:34:15>>insert into test.yeyz values (7,7),(8,8);
query ok, 2 rows affected (0.00 sec)
records: 2  duplicates: 0  warnings: 0

查看slave上面的复制情况和数据情况，如下：

mysql:(none) 22:39:05>>show slave status\g
*************************** 1. row ***************************
               slave_io_state: waiting for master to send event
                  master_host: 10.30.124.68
                  master_user: dba_repl
                  master_port: 4306
                connect_retry: 60
              master_log_file: mysqlbin.000002
          read_master_log_pos: 852
               relay_log_file: slave-relay-bin.000005
                relay_log_pos: 648
        relay_master_log_file: mysqlbin.000002
             slave_io_running: yes
            slave_sql_running: yes
              replicate_do_db: 
          replicate_ignore_db: 
           replicate_do_table: 
       replicate_ignore_table: 
      replicate_wild_do_table: 


mysql:(none) 22:40:15>>select * from test.yeyz;
+----+------+
| id | age  |
+----+------+
|  1 |    1 |
|  2 |    2 |
|  3 |    3 |
|  4 |    4 |
|  5 |    5 |
|  6 |    6 |
|  7 |    7 |
+----+------+
7 rows in set (0.00 sec)

可以看到，复制没有出现错误，即使从库上已经有id=7的记录。而且发现，从库的数据跟之前保持一致，也就是说，主库插入的id=8的记录没有被同步过来。

总结一下：该参数在跳过复制错误的时候，需要重启mysql服务，然后可能导致主从数据不一致。

03 slave-skip-errors=n参数

再看最后一个参数，这个参数表示的是并行复制过程中的从库复制模式，默认值是strict严格模式，和上面一样，我们先看主库和从库的数据情况：

master数据：

mysql:(none) 22:39:20>>select * from test.yeyz;                 
+----+------+
| id | age  |
+----+------+
|  1 |    1 |
|  2 |    2 |
|  3 |    3 |
|  4 |    4 |
|  5 |    5 |
|  6 |    6 |
|  7 |    7 |
|  8 |    8 |
+----+------+
8 rows in set (0.00 sec)

slave数据：

mysql:(none) 22:42:46>>select * from test.yeyz;
+----+------+
| id | age  |
+----+------+
|  1 |    1 |
|  2 |    2 |
|  3 |    3 |
|  4 |    4 |
|  5 |    5 |
|  6 |    6 |
|  7 |    7 |
|  8 |    8 |
|  9 |    9 |
+----+------+
9 rows in set (0.00 sec)

此时我们在从库上修改参数如下：

mysql:(none) 22:42:59>>show variables like '%exec%';
+----------------------------------+--------+
| variable_name                    | value  |
+----------------------------------+--------+
| gtid_executed_compression_period | 1000   |
| max_execution_time               | 0      |
| rbr_exec_mode                    | strict |
| slave_exec_mode                  | strict |
+----------------------------------+--------+
4 rows in set (0.00 sec)

mysql:(none) 22:44:05>>set global slave_exec_mode='idempotent';
query ok, 0 rows affected (0.00 sec)

mysql:(none) 22:44:10>>show variables like '%exec%';           
+----------------------------------+------------+
| variable_name                    | value      |
+----------------------------------+------------+
| gtid_executed_compression_period | 1000       |
| max_execution_time               | 0          |
| rbr_exec_mode                    | strict     |
| slave_exec_mode                  | idempotent |
+----------------------------------+------------+
4 rows in set (0.00 sec)

修改完参数，我们在主库上进行insert操作：

insert into test.yeyz values (9,9),(10,10);

查看从库的复制状态和数据情况，如下：

mysql:(none) 22:44:14>>show slave status\g
*************************** 1. row ***************************
               slave_io_state: waiting for master to send event
                  master_host: 10.30.124.68
                  master_user: dba_repl
                  master_port: 4306
                connect_retry: 60
              master_log_file: mysqlbin.000002
          read_master_log_pos: 1183
               relay_log_file: slave-relay-bin.000007
                relay_log_pos: 650
        relay_master_log_file: mysqlbin.000002
             slave_io_running: yes
            slave_sql_running: yes

1 row in set (0.00 sec)

mysql:(none) 22:44:38>>select * from test.yeyz;
+----+------+
| id | age  |
+----+------+
|  1 |    1 |
|  2 |    2 |
|  3 |    3 |
|  4 |    4 |
|  5 |    5 |
|  6 |    6 |
|  7 |    7 |
|  8 |    8 |
|  9 |    9 |
| 10 |   10 |
+----+------+
10 rows in set (0.00 sec)

可以发现，既没有出现复制错误，主库上插入的数据也同步过来了。

总结一下：

slave_exec_mode参数；
sql_slave_skip_counter=n参数;
slave-skip-errors=n参数。

这三个参数都能解决复制过程中的不一致情况，区别如下：

slave_exec_mode参数可以保证主从数据一致，其他两个不可以。

slave-skip-errors参数可以跳过制定的错误，但是需要重启实例，不能保证数据一致。

sql_slave_skip_counter参数需要在偏移量的复制模式下使用，不能保证数据一致。

以上就是mysql复制问题的三个参数分析的详细内容，更多关于mysql复制问题的资料请关注其它相关文章！

相关标签： MySQL 复制问题参数

上一篇： Jupyter Notebook读入csv文件时出错的解决方案

下一篇： vue脚手架项目创建

MySQL复制问题的三个参数分析

01 sql_slave_skip_counter参数

02 slave_skip_errors参数

03 slave-skip-errors=n参数

总结一下：

MySQL关于字符串中数字排序的问题分析

一个单引号引发的MYSQL性能问题分析

从MySQL复制功能中得到的一举三得实惠分析

一个单引号引发的MYSQL性能问题分析

从MySQL复制功能中得到的一举三得实惠分析

mysql的校对规则引起的问题分析

php的慢速日志引起的Mysql错误问题分析

MySQL大小写敏感导致的问题分析

MySQL大小写敏感导致的问题分析

mysql的校对规则引起的问题分析