elasticsearch 使用快照进行备份
elasticsearch也提供了备份集群中索引数据的策略——snapshot api.
它会备份整个集群的当前状态和数据,并保存到集群中各个节点共享的仓库中。
这个备份的进程是增量备份的,在第一次备份的基础上进行的第二次备份只备份新变化的数据。
创建elasticsearch快照进行备份。
1、 建立nfs文件共享服务
2、修改elasticsearch配置文件elasticsearch.yml,path.repo: **共享目录挂载的路径**,
3、创建快照仓库
4、创建快照
5、恢复快照到elasticsearch集群
建立nfs文件共享服务
服务端:
1、 安装nfs服务软件:
1 yum install rpcbind nfs-utils -y
2、 建立需要共享的目录,并修改文件权限为666, client用户访问id,在server中有,且对共享文件夹有rw权限。
1 mkdir /udisk/elasticsnapshot 2 chmod 0666 /udisk/elasticsnapshot -r
3、修改nfs服务配置文件, /etc/exports
/udisk/elasticsnapshot 10.9.121.211/32(rw,sync,all_squash) 10.9.134.110/32(rw,sync,all_squash) 10.9.90.103/32(rw,sync,all_squash) 10.19.36.230/32(rw,sync,all_squash) 10.19.63.103/32(rw,sync,all_squash) # /udisk/elasticsnapshot 为共享的目录, 10.9.121.211/32 为可以挂载此共享目录的ip, # 参数说明: # rw ro 该目录分享的权限是可擦写 (read-write) 或只读 (read-only),但最终能不能读写,还是与文件系统的 rwx 及身份有关。 # sync async sync 代表数据会同步写入到内存与硬盘中,async 则代表数据会先暂存于内存当中,而非直接写入硬盘! # no_root_squash root_squash 客户端使用 nfs 文件系统的账号若为 root 时,系统该如何判断这个账号的身份?预设的情况下,客户端 root 的身份会由 root_squash 的设定压缩成 nfsnobody, 如此对服务器的系统会较有保障。但如果你想要开放客户端使用 root 身份来操作服务器的文件系统,那么这里就得要开 no_root_squash 才行! # all_squash 不论登入 nfs 的使用者身份为何, 他的身份都会被压缩成为匿名用户,通常也就是 nobody(nfsnobody) 啦! # anonuid anongid anon 意指 anonymous (匿名者) 前面关于 *_squash 提到的匿名用户的 uid 设定值,通常为 nobody(nfsnobody),但是你可以自行设定这个 uid 的值!当然,这个 uid 必需要存在于你的 /etc/passwd 当中! anonuid 指的是 uid 而 anongid 则是群组的 gid 啰。
4、 配置生效 exportfs -r
5、 启动服务
1 systemctl start rpcbind 2 systemctl start nfs
客户端:
1、安装客户端软件:
1 yum install nfs-utils -y
2、新建挂载目录:mkdir /mnt/es
3、挂载共享目录: **为了提高nfs的稳定性,使用tcp协议挂载,nfs默认用udp协议**
1 mount -t nfs 10.10.10.10:/udisk/elasticsnapshot /mnt/es -o proto=tcp -o nolock
4、每台es机器为客户端,进行客户端配置
修改elasticsearch的配置文件elasticsearch.yml,添加下面配置,并重启
path.repo: '/mnt/es'
创建快照仓库
put /_snapshot/my_backup { "type": "fs", "settings": { "location": "/mnt/es", "compress": true, # 是否压缩 "max_snapshot_bytes_per_sec": "50mb", "max_restore_bytes_per_sec": "50mb" } }
创建快照
put /_snapshot/my_backup/back-2018-10-26 { "indices": "*", # * 表示所有index, 可以具体写哪些"logstash-iis-2017-01-07,logstash-httperr-2017-01-07", "ignore_unavailable": true, "include_global_state": false }
上面的代码会将所有正在运行的索引,备份到my_backup仓库下一个叫snapshot_1的快照中。上面的api会立刻返回,然后备份工作在后台运行。如果你想api同步执行,可以加wait_for_completion标志:
put /_snapshot/my_backup/snapshot_1?wait_for_completion=true
查看快照
1 get _snapshot/my_backup/back-2018-10-26 2 # 会出现一下结果 3 { 4 "snapshots": [ 5 { 6 "snapshot": "logstash-2017-01-07", 7 "uuid": "0xm7x-hcr4u9ou7-gjzj5w", 8 "version_id": 5000299, 9 "version": "5.0.2", 10 "indices": [ 11 "logstash-iis-2017-01-07", 12 "logstash-httperr-2017-01-07" 13 ], 14 "state": "success", 15 "start_time": "2017-01-09t09:04:03.983z", 16 "start_time_in_millis": 1483952643983, 17 "end_time": "2017-01-09t09:05:37.524z", 18 "end_time_in_millis": 1483952737524, 19 "duration_in_millis": 93541, 20 "failures": [], 21 "shards": { 22 "total": 10, 23 "failed": 0, 24 "successful": 10 25 } 26 } 27 ] 28 }
1、查看所有索引的信息,使用如下api:
get http://127.0.0.1:9200/_snapshot/my_backup/_all
2、另外还有个一api可以看到更加详细的信息:
get http://127.0.0.1:9200/_snapshot/my_backup/snapshot_3/_status
快照恢复
post /_snapshot/my_backup/logstash-2017-01-07/_restore
1、 此api额外参数:
post http://127.0.0.1:9200/_snapshot/my_backup/snapshot_1/_restore { "indices": "index_1", "rename_pattern": "index_(.+)", "rename_replacement": "restored_index_$1" }
参数indices 设置只恢复index_1索引,参数rename_pattern 和rename_replacement 用来正则匹配要恢复的索引,并且重命名。和备份一样,api会立刻返回值,然后在后台执行恢复,使用wait_for_completion 标记强制同步执行。
2、 另外可以使用下面两个api查看状态:
get http://127.0.0.1:9200/_recovery/restored_index_3 get http://127.0.0.1:9200/_recovery/
3 取消恢复: 如果要取消恢复过程(不管是已经恢复完,还是正在恢复),直接删除索引即可