MySQL5.6crash-safereplication一个坑

程序员文章站 2022-04-09 20:40:59

...

事情起因：唯品会一个DBA找到我，说他们的slave掉电，再重启服务器以后，同步复制就挂了，报1032和1062错误，首先排查了在从库上没有写操作，之后询问了他们的参数。这是他们的参数： sync_master_info=1sync_relay_log_info=1relay_log_info_repository=FI

事情起因：唯品会一个DBA找到我，说他们的slave掉电，再重启服务器以后，同步复制就挂了，报1032和1062错误，首先排查了在从库上没有写操作，之后询问了他们的参数。

这是他们的参数：

sync_master_info = 1
sync_relay_log_info = 1
relay_log_info_repository = FILE

参数意思是：sql线程每次执行完了一个事务，就会记录在master.info和relay.info文件里。即：

START TRANSACTION;
-- Statement 1
-- ...
-- Statement N
COMMIT;
-- Update replication info files

由于在记录relay.info的时候宕机，relay.info未更新，机器重启恢复后会从之前的POS点再次执行，这样就执行了两条同样的SQL，就会报1032和1062错误，同步就挂了。

于是我建议他们设置：

relay_log_info_repository = TABLE
relay_log_recovery =  1
alter table mysql.slave_relay_log_info engine=innodb;

参数意思是：把relay.info改成记录在slave_relay_log_info表里，并改成innodb引擎，并开启relay_log_recovery中继日志自我修复功能。即：

START TRANSACTION;
-- Statement 1
-- ...
-- Statement N
-- Update replication info
COMMIT;

这样sql线程执行完事务后，立即会更新slave_relay_log_info表，如果在更新过程中宕机，事务会回滚，slave_relay_log_info表并不会记录同步的点，下次重新同步复制时，从之前的POS点再次执行。

看似很完美了，但之后我在虚拟机上做了测试，发现了一个BUG：

即针对DDL语句，不会触发刷盘操作，而DML语句不会有该问题，也就是说slave_relay_log_info表不会更新，必须手工执行stop slave;start slave;该表才会强制刷新。

试想一下，你修改了表结构以后，突然宕机，slave_relay_log_info表没刷进磁盘，下次重启服务后，会再次执行一次修改表结构，此时同步就挂了，你只能手工去跳过这个错误。

我测试的版本是：5.6.22-71.0-log Percona Server (GPL), Release 71.0, Revision 726

参考：

MySQL5.6crash-safereplication一个坑

相关标签： MySQL5.6crash-safereplication

上一篇： CentOS编译安装MongoDB

下一篇： mysql查询学生成绩及各科成绩的排名

MySQL5.6crash-safereplication一个坑

WinXP系统安装direct9.0时提示不能信任一个安装所需的压缩文件的解决方法

新浪微博图片服务器出现大面积故障延参法师称被坑哭了

mysql踩坑之limit与sum函数混合使用问题详解

Photoshop制作一个毛茸茸的草绿色网球图标

js控制一个按钮是否可点击(可使用)disabled的实例

python判断文件是否存在,不存在就创建一个的实例

解析一个通过添加本地分区索引提高SQL性能的案例

浅谈pandas筛选出表中满足另一个表所有条件的数据方法

C#实现多线程写入同一个文件的方法

Python利用heapq实现一个优先级队列的方法

MySQL5.6crash-safereplication一个坑

WinXP系统安装direct9.0时提示不能信任一个安装所需的压缩文件的解决方法

新浪微博图片服务器出现大面积故障 延参法师称被坑哭了

mysql踩坑之limit与sum函数混合使用问题详解

Photoshop制作一个毛茸茸的草绿色网球图标

js控制一个按钮是否可点击(可使用)disabled的实例

python判断文件是否存在,不存在就创建一个的实例

解析一个通过添加本地分区索引提高SQL性能的案例

浅谈pandas筛选出表中满足另一个表所有条件的数据方法

C#实现多线程写入同一个文件的方法

Python利用heapq实现一个优先级队列的方法

新浪微博图片服务器出现大面积故障延参法师称被坑哭了