容器化 | 基于 Kubernetes 的新一代 MySQL 高可用架构实现方案
作者:高日耀 资深 mysql 内核研发
本文源于作者在 kubesphere & friends 2021 杭州站 的演讲内容《基于 kubernetes 的新一代 mysql 高可用架构实现方案》。
本文是 mysql 容器化系列的第三篇文章,主要介绍 mysql 容器化 helm 版本[1] 的设计思路。
dockerfile 简介
首先 radondb mysql 一个 pod 中的容器角色中,一般包含 mysql、xenon、slowlog 三个容器。
其中,mysql 和 xenon dockerfile 目录结构如下所示:
mysql dockerfile 解析
启动 mysql 主进程前,需要准备数据库配置、初始化等,这些工作要在最终的 mysql 运行之前解决。在制作镜像时,通过配置 mysql dockerfile 中 entrypoint
和 cmd
参数,可提前准备数据库配置、初始化等进程。
docker 是分层的,每一条命令都会建一个镜像层,分层太多会导致快速膨胀。在制作镜像时,不建议分层太多。
mysql dockerfile
文件中命令示例如下:
mysql mysql-entry.sh
文件中包含启动命令,其主要执行流程如下:
xenon dockerfile 解析
xenon dockerfile 比较简单,跟 mysql dockerfile 流程类似。
xenon dockerfile
命令示例如下:
xenon-entry.sh
主要功能:
- 生成 xenon 配置文件,在 xenon 启动的时候调用
- ping host
name 生成及环境变量
name 生成
首先我们看下 chart 目录下功能文件列表,chart 下包含的文件如下图所示:
其中,_helpers.tpl
常需引用 chart.yaml
和 values.yaml
中定义的变量,继而实现如下能力:
- 生成 app 名字:helm install release <版本名,如 emo> <项目名,如radondb-mysql>
- 生成
serviceaccountname
名字。- 生成 chart 名字和版本。
通过命令 helm get all demo
,可查看 demo 中所有信息。查看 service 部分 name 示例如下:
104 # source: radondb-mysql/templates/serviceaccount.yaml 105 apiversion: v1 106 kind: serviceaccount 107 metadata: 108 name: demo-radondb-mysql 109 labels: 110 app: demo-radondb-mysql 111 chart: radondb-mysql-1.0.0 112 release: "demo" 113 heritage: "helm"
环境变量
环境变量 主要目的是保存密码和配置参数解耦。
-
secrets.yaml 功能
- opaque
- base64 转码
- 加密插件
-
configmap.yaml 功能
- 将配置参数和 docker 镜像解耦
- 保存一些配置参数和修改 lable 的脚本
如何识别集群中 leader、follower 角色?
识别集群节点角色,需创建一个服务账号,并授予相应的权限。通过执行在 config
文件中保存的脚本,调用相应的 api 来修改对应角色的 lable。
节点角色修改后,相应 lable 效果如下。此时,通过服务标签后缀,即可轻松辨别 leader 和 follower 角色的节点。
在 kubesphere[2] 管理控制台,可查看到角色修改后示例如下:
如何实现读写分离?
radondb mysql 读写分离,通过 headless service for stable dns [3] 来实现。
分配一个集群内部可以访问的虚拟 ip (vip),vip 是固定的,而节点所绑定的 pod 的 ip 是可以变化的,每个 node 上分配一个端口作为外部访问入口。以此特点,可以设定一个读 ip 和一个写 ip,来达到读写分离的目的,而无需担心新绑定 pod 致使 ip 发生变化。
以 leader 节点为例,下图所示的 clusterip 对应写 ip(10.111.92.63
), 其绑定当前的 pod(主)ip 为 172.17.0.10
。
邂逅 kubeshpere
radondb mysql 已经登录 kubesphere 应用商店(3.1.0 版本推出),可以通过 kubesphere 来实现对集群的查看和管理。
1、通过终端查看集群正常时 gtid 和对应的状态
2、模拟 follower 节点挂掉场景
kill 掉名为 demo-radondb-mysql-2 的 follower:
从另外一个节点登入终端再次查看集群状态,该 follower 节点 mysql 和 io/sql 状态都不正常。
从 kubesphere 界面查看:
挂掉的节点重新拉起,集群开始重新发起选举:
3、leader (demo-radondb-mysql-0) 节点挂掉场景
leader 降级为 follower,原来另外两个从节点进入候选者状态:
从 kubesphere 界面查看,这时已经查不到 leader pod:
等待一段时间,集群选出新主(demo-radondb-mysql-2):
从 kubesphere 看到原来的主(demo-radondb-mysql-0)变为 follower:
4、网络隔离
将新主(demo-radondb-mysql-2) 隔离。
等待一段时间,可以看到新主(demo-radondb-mysql-0)重新被选出:
[1]. radondb mysql kubernetes:
[2]. kubesphere:
[3]. headless service: