数据库mysql高可用配置架构部署实施
mysql高可用
1、普通主从复制架构存在的不足
高可用?
业务不间断的工作。
用户的体验不出来业务断点。
普通主从环境,存在的问题:
1、监控的问题:app应用程序,并不具备监控数据库的功能,没有责任监控数据库是否能连接。 2、选主的问题: 3、failover:vip漂移,对于应用透明 4、数据补偿
2、企业高可用解决方案:
mmm(过时)
mha(目前推荐)
pxc、galera cluster(出现很多年,企业很少用)
5.7.17 mgr 、innodb cluster(未来的趋势,尽早研究)
mysql ndb cluster(出现很多年,仍然不完善)
mycat 高可用
3、mha高可用架构部署实战:
3.0 mha介绍及工作原理
(1)manager程序负责监控所有已知node(1主2从所有节点) (2)当主库发生意外宕机 (2.1)mysql实例故障(ssh能够连接到主机) 0、监控到主库宕机,选择一个新主(取消从库角色,reset slave),选择标准:数据较新的从库会被选择为新主(show slave status\g) 1、从库通过mha自带脚本程序,立即保存缺失部分的binlog 2、二号从库会重新与新主构建主从关系,继续提供服务 3、如果vip机制,将vip从原主库漂移到新主,让应用程序无感知 (2.2)主节点服务器宕机(ssh已经连接不上了) 0、监控到主库宕机,尝试ssh连接,尝试失败 1、选择一个数据较新的从库成为新主库(取消从库角色 reset slave),判断细节:show slave status\g 2、计算从库之间的relay-log的差异,补偿到2号从库 3、二号从库会重新与新主构建主从关系,继续提供服务 4、如果vip机制,将vip从原主库漂移到新主,让应用程序无感知 5、如果有binlog server机制,会继续将binlog server中的记录的缺失部分的事务,补偿到新的主库
3.1、安装mha node:
依赖包perl-dbd-mysql ,并在三个节点都安装node软件
mha高可用架构部署细节: 三台mysql独立节点实例,主机名、ip、防火墙关闭等 开启1主2从gtid复制结构 关闭各节点relay-log自动删除功能 各节点部署node工具包及依赖包 选择其中一个从节点进行部署manager工具包 各节点ssh秘钥互信配置 配置manager节点配置文件(注意:在数据库中添加mha管理用户和密码) 做ssh互信检查和主从状态检查 开启mha功能 检查防火墙和enforce开关情况: iptables -l getenforce 关闭二进制日志删除功能:relay_log_purge=0; 数据库中全局关闭:set relay_log_purge=0; 检查状态:mysql -e "show variables like '%relay%'"; 上传mha软件,然后解压:unzip mha.zip #涉及到安装两个软件,node和manager; 依赖包perl-dbd-mysql ,并在三个节点都安装node软件(三个节点都安装node) rpm包直接 rpm -ivh mha4mysql-node-0.56-0.el6.noarch.rpm
3.2、主库中创建mha管理用户
grant all privileges on *.* to mha@'10.0.0.%' identified by 'mha'; (会同步给从库)
3.3、配置软连接
ln -s /application/mysql/bin/mysqlbinlog /usr/bin/mysqlbinlog ln -s /application/mysql/bin/mysql /usr/bin/mysql #mha小bug只能在/usr/bin下使用
3.4、部署manger节点(建议在从节点db03)
wget -o /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-6.repo yum install -y perl-config-tiny epel-release perl-log-dispatch perl-parallel-forkmanager perl-time-hires
3.5、安装 manager软件
rpm -ivh mha4mysql-manager-0.56-0.el6.noarch.rpm
3.6、创建manager必要目录与配置文件(db03)
mkdir -p /etc/mha mkdir -p /var/log/mha/app1 ----》可以管理多套主从复制 创建配置文件 (不需要的配置不要留着,注释没用,切换后会重写) vim /etc/mha/app1.cnf -----》serverdefault可以独立 [server default] manager_log=/var/log/mha/app1/manager manager_workdir=/var/log/mha/app1 master_binlog_dir=/data/binlog user=mha password=mha ping_interval=2 repl_password=123 repl_user=repl ssh_user=root [server1] hostname=10.0.0.51 port=3306 [server2] hostname=10.0.0.52 port=3306 [server3] hostname=10.0.0.53 port=3306
3.7、配置互信(所有节点)
ssh-keygen -t dsa -p '' -f ~/.ssh/id_dsa >/dev/null 2>&1 ssh-copy-id -i /root/.ssh/id_dsa.pub root@10.0.0.51 ssh-copy-id -i /root/.ssh/id_dsa.pub root@10.0.0.52 ssh-copy-id -i /root/.ssh/id_dsa.pub root@10.0.0.53 测试:ssh 10.0.0.51 date ...
3.8、检测互信
masterha_check_ssh --conf=/etc/mha/app1.cnf
3.9、检测主从
masterha_check_ssh --conf=/etc/mha/app1.cnf
3.10、启动mha manager
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 & tail -f /var/log/mha/app1/manager
故障演练:
1、宕掉db01主库 /etc/init.d/mysqld stop 2、tail -f /var/log/mha/app1/manager 观察日志变化(实时监控日志) 3、恢复主库运行,重新将db01加入到主从复制关系中 检查状态: show slave stauts\g; /etc/init.d/mysqld start change master to master_host='10.0.0.52', master_port=3306, master_auto_position=1, master_user='repl', master_password='123'; start slave; show slave status\g; 4、将配置文件中加入修稿的故障节点(宕机后自动删除被删除的server信息) 5、启动mha了manager程序(经历主库宕机后,manager会完成自杀进程的步骤) masterha_check_ssh --conf=/etc/mha/app1.cnf masterha_check_ssh --conf=/etc/mha/app1.cnf nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &
3.11、使用mha自带脚本实现ip failover(vip 漂移,应用透明)
#################################end#########################################
配置步骤
上传准备好的/usr/local/bin/master_ip_failover(脚本文件) chmod +x master_ip_failover dos2unix /usr/local/bin/master_ip_failover vim /etc/mha/app1.cnf 添加: master_ip_failover_script=/usr/local/bin/master_ip_failover 重启mha masterha_stop --conf=/etc/mha/app1.cnf nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &
手工在主库上绑定vip,注意一定要和配置文件中的ethn一致(master_ip_failover),我的是eth0:1(1是key指定的值)
ifconfig eth0:1 10.0.0.55/24
切换测试:
停主库,看vip是否漂移
/etc/init.d/mysqld stop
3.12、binlogserver配置:
找一台额外的机器,必须要有5.6以上的版本,支持gtid并开启,我们直接用的第二个slave vim /etc/mha/app1.cnf(在10.0.0.53机器上) [binlog1] no_master=1 hostname=10.0.0.53 master_binlog_dir=/data/mysql/binlog 提前创建好,这个目录不能和原有的binlog一致 mkdir -p /data/mysql/binlog chown -r mysql.mysql /data/mysql/* 修改完成后,将主库binlog拉过来(从000001开始拉,之后的binlog会自动按顺序过来) cd /data/mysql/binlog -----》必须进入到自己创建好的目录,在主库的/data/binlog目录中查看是否是从以下001开始的。 mysqlbinlog -r --host=10.0.0.51 --user=mha --password=mha --raw --stop-never mysql-bin.000001 & 重启mha,生效配置: 重启mha masterha_stop --conf=/etc/mha/app1.cnf nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &
3.13、其他参数说明
ping_interval=2 manager检测节点存活的间隔时间,总共会探测4次。
设置为候选master,如果设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个主库不是集群中事件最新的slave
candidate_master=1
默认情况下如果一个slave落后master 100m的relay logs的话,mha将不会选择该slave作为一个新的master,
因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,
mha触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,
因为这个候选主在切换的过程中一定是新的master
check_repl_delay=0
原文地址:https://www.cnblogs.com/cuiyongchao007/p/12861355.html
上一篇: CentOS7.2离线安装字体
推荐阅读
-
MySQL数据库实现MMM高可用群集架构
-
MySQL之MHA高可用配置及故障切换实现详细部署步骤
-
Ubuntu编译安装HAprox+Keepalived+MySQL负载高可用架构(结合Docker容器配置)
-
数据库mysql高可用配置架构部署实施
-
MySQL数据库的高可用架构方案实例讲解
-
MySQL数据库实现MMM高可用群集架构
-
Ubuntu编译安装HAprox+Keepalived+MySQL负载高可用架构(结合Docker容器配置)
-
数据库高可用架构(MySQL、Oracle、MongoDB、Redis)
-
数据库高可用架构(MySQL、Oracle、MongoDB、Redis)
-
MySQL高可用架构之MySQL-MMM配置详解