003.etcd集群部署-静态发现
程序员文章站
2022-09-04 16:42:45
一 etcd集群概述 1.1 概述 静态启动etcd集群要求每个成员都知道集群中的另一个成员。Etcd运行在集群的每个coreos节点上,可以保证coreos集群的稳定,可靠的运行。当集群网络出现动荡,或者当前master节点出现异常时,etcd可以进行master节点的选举工作,同时恢复集群中损失 ......
一 etcd集群概述
1.1 概述
静态启动etcd集群要求每个成员都知道集群中的另一个成员。etcd运行在集群的每个coreos节点上,可以保证coreos集群的稳定,可靠的运行。当集群网络出现动荡,或者当前master节点出现异常时,etcd可以进行master节点的选举工作,同时恢复集群中损失的数据。
1.2 集群容错能力
1.3 集群基础
每个 etcd cluster 都由若干个 member 组成的,每个 member 是一个独立运行的 etcd 实例,单台机器上也可以运行多个 member。
在正常运行的状态下,集群中会有一个 leader,其余的 member 都是 followers。leader 向 followers 同步日志,保证数据在各个 member 都有副本。leader 还会定时向所有的 member 发送心跳报文,如果在规定的时间里 follower 没有收到心跳,就会重新进行选举。
客户端所有的请求都会先发送给 leader,leader 向所有的 followers 同步日志,等收到超过半数的确认后就把该日志存储到磁盘,并返回响应客户端。
每个 etcd 服务有三大主要部分组成:raft 实现、wal 日志存储、数据的存储和索引。
wal 会在本地磁盘(即 --data-dir)上存储日志内容(wal file)和快照(snapshot)。
提示:etcd 默认只保存 1000 个历史事件,因此不适合有大量更新操作的场景,否则会导致数据的丢失。etcd 典型的应用场景是配置管理和服务发现,即读多写少的。
1.4 引导机制
- 静态的
在启动 etcd server 的时候,通过 --initial-cluster 参数配置好所有的节点信息
- etcd discovery
使用已有的 etcd cluster 来注册和启动
- dns发现
使用 dns 启动。
二 集群部署-静态
2.1 环境准备
ntp配置:略 #建议配置ntp服务,保证时间一致性
etcd版本:v3.3.9
防火墙及selinux:关闭防火墙和selinux
1 # hostnamectl set-hostname etcd1.example.com 2 # hostnamectl set-hostname etcd2.example.com 3 # hostnamectl set-hostname etcd3.example.com 4 # vi /etc/hosts 5 #…… 6 172.24.8.31 etcd1.example.com 7 172.24.8.32 etcd2.example.com 8 172.24.8.33 etcd3.example.com
提示:centos6.x则修改/etc/sysconfig/network。
2.2 安装etcd
1 # etcd_ver=v3.3.9 2 # github_url=https://github.com/coreos/etcd/releases/download 3 # download_url=${github_url} 4 # rm -f /tmp/etcd-${etcd_ver}-linux-amd64.tar.gz 5 # rm -rf /tmp/etcd-download-test 6 # mkdir -p /tmp/etcd-download-test #创建下载保存目录 7 # curl -l ${download_url}/${etcd_ver}/etcd-${etcd_ver}-linux-amd64.tar.gz -o /tmp/etcd-${etcd_ver}-linux-amd64.tar.gz 8 # tar xzvf /tmp/etcd-${etcd_ver}-linux-amd64.tar.gz -c /tmp/etcd-download-test --strip-components=1 9 # cp /tmp/etcd-download-test/etcd /usr/local/bin/ 10 # cp /tmp/etcd-download-test/etcdctl /usr/local/bin/ 11 # rm -f /tmp/etcd-${etcd_ver}-linux-amd64.tar.gz 12 13 # rm -rf /tmp/etcd-download-test/ 14 # etcdctl_api=3 15 # etcd --version 16 # etcdctl --version #查看已安装版本
提示:所有节点均需要安装etcd。
2.3 启动前准备
1 # mkdir -p /var/log/etcd/ #建议创建etcd日志保存目录 2 # mkdir -p /data/etcd #建议创建单独的etcd数据目录
2.4 启动集群
1 [root@etcd1 ~]# etcd --name etcd1 --data-dir /data/etcd \ 2 --initial-advertise-peer-urls http://172.24.8.31:2380 \ 3 --listen-peer-urls http://172.24.8.31:2380 \ 4 --listen-client-urls http://172.24.8.31:2379,http://127.0.0.1:2379 \ 5 --advertise-client-urls http://172.24.8.31:2379 \ 6 --initial-cluster-token etcd-cluster-1 \ 7 --initial-cluster etcd1=http://172.24.8.31:2380,etcd2=http://172.24.8.32:2380,etcd3=http://172.24.8.33:2380 \ 8 --initial-cluster-state new
注意:第一台启动的 etcd 服务器将会不断等待其他集群成员完成初始化连接, 处于 waiting 状态。
1 [root@etcd2 ~]# etcd --name etcd2 --data-dir /data/etcd \ 2 --initial-advertise-peer-urls http://172.24.8.32:2380 \ 3 --listen-peer-urls http://172.24.8.32:2380 \ 4 --listen-client-urls http://172.24.8.32:2379,http://127.0.0.1:2379 \ 5 --advertise-client-urls http://172.24.8.32:2379 \ 6 --initial-cluster-token etcd-cluster-1 \ 7 --initial-cluster etcd1=http://172.24.8.31:2380,etcd2=http://172.24.8.32:2380,etcd3=http://172.24.8.33:2380 \ 8 --initial-cluster-state new 9 10 [root@etcd3 ~]# etcd --name etcd3 --data-dir /data/etcd \ 11 --initial-advertise-peer-urls http://172.24.8.33:2380 \ 12 --listen-peer-urls http://172.24.8.33:2380 \ 13 --listen-client-urls http://172.24.8.33:2379,http://127.0.0.1:2379 \ 14 --advertise-client-urls http://172.24.8.33:2379 \ 15 --initial-cluster-token etcd-cluster-1 \ 16 --initial-cluster etcd1=http://172.24.8.31:2380,etcd2=http://172.24.8.32:2380,etcd3=http://172.24.8.33:2380 \ 17 --initial-cluster-state new
提示:etcd可通过配置文件、命令行参数和环境变量进行配置,在命令行上设置的选项优先于来自环境的选项。如果提供了配置文件,则将忽略其他命令行参数和环境变量。例如,etcd --config-file etcd.conf.yml --data-dir /tmp将忽略该--data-dir标志。即优先级为:配置文件>命令行参数>环境变量。
配置文件为yml的文件,可参考《附001.etcd实例配置文件》
建议:
建议根据以下操作将启动命令写成固定脚本:
1 [root@etcd1 ~]# vi /root/startetcd.sh 2 #!/bin/sh 3 #****************************************************************# 4 # scriptname: /root/startetcd.sh 5 # author: xiang hongying 6 # create date: 2018-09-10 01:14 7 # modify author: xiang hongying 8 # e-mail: x120952576@126.com 9 # version: 10 #***************************************************************# 11 logfile=/var/log/etcd/etcd.log 12 /usr/local/bin/etcd --name etcd1 --data-dir /data/etcd \ 13 --initial-advertise-peer-urls http://172.24.8.31:2380 \ 14 --listen-peer-urls http://172.24.8.31:2380 \ 15 --listen-client-urls http://172.24.8.31:2379,http://127.0.0.1:2379 \ 16 --advertise-client-urls http://172.24.8.31:2379 \ 17 --initial-cluster-token etcd-cluster-1 \ 18 --initial-cluster etcd1=http://172.24.8.31:2380,etcd2=http://172.24.8.32:2380,etcd3=http://172.24.8.33:2380 \ 19 -initial-cluster-state new >> $logfile 2>&1 & 20 [root@etcd1 ~]# chmod u+x startetcd.sh
2.5 集群健康检测
1 [root@etcd1 ~]# etcdctl cluster-health
附录:使用systemd管理etcd。
1 [root@etcd1 ~]# vi /lib/systemd/system/etcd.service 2 [unit] 3 description=etcd 4 documentation=https://github.com/coreos/etcd 5 conflicts=etcd.service 6 7 [service] 8 type=notify 9 restart=always 10 restartsec=5s 11 limitnofile=40000 12 timeoutstartsec=0 13 14 execstart=/usr/local/bin/etcd --name etcd1 --data-dir /data/etcd \ 15 --initial-advertise-peer-urls http://172.24.8.31:2380 \ 16 --listen-peer-urls http://172.24.8.31:2380 \ 17 --listen-client-urls http://172.24.8.31:2379,http://127.0.0.1:2379 \ 18 --advertise-client-urls http://172.24.8.31:2379 \ 19 --initial-cluster-token etcd-cluster-1 \ 20 --initial-cluster etcd1=http://172.24.8.31:2380,etcd2=http://172.24.8.32:2380,etcd3=http://172.24.8.33:2380 \ 21 --initial-cluster-state new 22 23 [install] 24 wantedby=multi-user.target 25 [root@etcd1 ~]# systemctl daemon-reload 26 [root@etcd1 ~]# systemctl start etcd.service 27 [root@etcd1 ~]# systemctl enable etcd.service
提示:其他节点类似即可。
2.6 关闭集群
1 [root@etcd1 ~]# systemctl stop etcd
提示:
使用systemctl stop etcd 关闭集群, 在重新启动集群, 之前 etcd 保存的资料不会丢失 要对 etcd 集群进行重置, 最简单的方式是关闭集群后, 删除了所有 etcd member 中etcd_data_dir 配置中定义的目录下的所有子目录,然后启动所有 member 即可。
三 集群管理
3.1 集群成员检测
1 [root@etcd1 ~]# etcdctl member list
3.2 更新成员url
若成员etcd2的ip地址有变动,需要更新url,则需要执行以下操作:
1 [root@etcd3 ~]# ifconfig eth0 2 inet 172.24.8.40 3 [root@etcd3 ~]# vi /lib/systemd/system/etcd.service #将所有旧ip改为最新ip。
提示:将所有ip修改为新的ip,若使用命令参数启动,则在命令参数中修改此ip为新值即可。
1 [root@etcd3 ~]# systemctl restart etcd 2 [root@etcd1 ~]# etcdctl member list #在leader节点查看所有节点
1 [root@etcd1 ~]# etcdctl member update 14ff148c62a24fb2 http://172.24.8.40:2380 #更新对等url
提示:错误更新的客户端url不会影响etcd群集的运行状况。
3.3 添加新成员
1 [root@localhost ~]# hostnamectl set-hostname etcd4.example.com
参考2.3步骤在etcd4.example.com节点安装etcd。
1 [root@etcd1 ~]# etcdctl member add etcd4 http://172.24.8.34:2380
1 [root@etcd4 ~]# export etcd_name="etcd4" 2 [root@etcd4 ~]# export etcd_initial_cluster="etcd4=http://172.24.8.34:2380,etcd3=http://172.24.8.40:2380,etcd1=http://172.24.8.31:2380,etcd2=http://172.24.8.32:2380" 3 [root@etcd4 ~]# export etcd_initial_cluster_state="existing" 4 [root@etcd4 ~]# etcd --listen-client-urls http://172.24.8.34:2379,http://127.0.0.1:2379 --advertise-client-urls http://172.24.8.34:2379 --listen-peer-urls http://172.24.8.34:2380 --initial-advertise-peer-urls http://172.24.8.34:2380 --data-dir /data/etcd 5 [root@etcd1 ~]# etcdctl member list 6 [root@etcd1 ~]# etcdctl cluster-health
提示:当使用已删除成员的数据目录启动etcd时,如果etcd连接到集群中的任何活动成员,它将自动退出,可通过以下方式删除旧member的数据,然后重新启动:
1 # rm -rf /var/lib/etcd/default.etcd/ 2 # systemctl start etcd
3.4 删除成员
1 [root@etcd1 ~]# etcdctl member remove 5a6397499417250 2 removed member 5a6397499417250 from cluster
提示:删除leader是安全的,但是当选出新领导者时,群集将处于非活动状态。此持续时间通常是选举超时和投票过程的时间段。
四 集群部署-发现
见《004.etcd集群部署-发现》
参考官方文档:
https://github.com/etcd-io/etcd/blob/master/documentation/op-guide/configuration.md