Redis之高可用、集群、云平台搭建

程序员文章站 2022-06-24 11:14:20

文章大纲一、基础知识学习二、Redis常见的几种架构及优缺点总结三、Redis之Redis Sentinel（哨兵）实战四、Redis之Redis Cluster（分布式集群）实战五、Java之Jedis连接Redis（Redis Cluster版本）六、Redis之云平台介绍七、项目源码与资料下 ......

文章大纲

一、基础知识学习
二、redis常见的几种架构及优缺点总结
三、redis之redis sentinel（哨兵）实战
四、redis之redis cluster（分布式集群）实战
五、java之jedis连接redis（redis cluster版本）
六、redis之云平台介绍
七、项目源码与资料下载
八、参考文章

一、基础知识学习

redis的基础包括以下内容，可参考文章https://www.cnblogs.com/wuxiaochang/p/10832330.html进行学习
（1）安装并设置开机自动启动
（2）redis文件结构
（3）redis启动方式
（4）redis持久化
（5）redis配置文件详解
（7）redis图形化工具
（8）java之jedis连接redis单机

二、redis常见的几种架构及优缺点总结

1. redis单副本

redis单副本，采用单个redis节点部署架构，没有备用节点实时同步数据，不提供数据持久化和备份策略，适用于数据可靠性要求不高的纯缓存业务场景。

优点
架构简单，部署方便；
高性价比：缓存使用时无需备用节点（单实例可用性可以用supervisor或crontab保证），当然为了满足业务的高可用性，也可以牺牲一个备用节点，但同时刻只有一个实例对外提供服务；
高性能。

缺点
不保证数据的可靠性；
在缓存使用，进程重启后，数据丢失，即使有备用的节点解决高可用性，但是仍然不能解决缓存预热问题，因此不适用于数据可靠性要求高的业务；
高性能受限于单核cpu的处理能力（redis是单线程机制），cpu为主要瓶颈，所以适合操作命令简单，排序、计算较少的场景。也可以考虑用memcached替代。

2. redis多副本（主从）

redis多副本，采用主从（replication）部署结构，相较于单副本而言最大的特点就是主从实例间数据实时同步，并且提供数据持久化和备份策略。主从实例部署在不同的物理服务器上，根据公司的基础环境配置，可以实现同时对外提供服务和读写分离策略。

优点
高可靠性：一方面，采用双机主备架构，能够在主库出现故障时自动进行主备切换，从库提升为主库提供服务，保证服务平稳运行；另一方面，开启数据持久化功能和配置合理的备份策略，能有效的解决数据误操作和数据异常丢失的问题；
读写分离策略：从节点可以扩展主库节点的读能力，有效应对大并发量的读操作。

缺点
故障恢复复杂，如果没有redisha系统（需要开发），当主库节点出现故障时，需要手动将一个从节点晋升为主节点，同时需要通知业务方变更配置，并且需要让其它从库节点去复制新主库节点，整个过程需要人为干预，比较繁琐；
主库的写能力受到单机的限制，可以考虑分片；
主库的存储能力受到单机的限制，可以考虑pika；
原生复制的弊端在早期的版本中也会比较突出，如：redis复制中断后，slave会发起psync，此时如果同步不成功，则会进行全量同步，主库执行全量备份的同时可能会造成毫秒或秒级的卡顿；又由于cow机制，导致极端情况下的主库内存溢出，程序异常退出或宕机；主库节点生成备份文件导致服务器磁盘io和cpu（压缩）资源消耗；发送数gb大小的备份文件导致服务器出口带宽暴增，阻塞请求，建议升级到最新版本。

3. redis sentinel（哨兵）

redis sentinel是社区版本推出的原生高可用解决方案，其部署架构主要包括两部分：redis sentinel集群和redis数据集群。
其中redis sentinel集群是由若干sentinel节点组成的分布式集群，可以实现故障发现、故障自动转移、配置中心和客户端通知。redis sentinel的节点数量要满足2n+1（n>=1）的奇数个。

优点
redis sentinel集群部署简单；
能够解决redis主从模式下的高可用切换问题；
很方便实现redis数据节点的线形扩展，轻松突破redis自身单线程瓶颈，可极大满足redis大容量或高性能的业务需求；
可以实现一套sentinel监控一组redis数据节点或多组数据节点。

缺点
部署相对redis主从模式要复杂一些，原理理解更繁琐；
资源浪费，redis数据节点中slave节点作为备份节点不提供服务；
redis sentinel主要是针对redis数据节点中的主节点的高可用切换，对redis的数据节点做失败判定分为主观下线和客观下线两种，对于redis的从节点有对节点做主观下线操作，并不执行故障转移。
不能解决读写分离问题，实现起来相对复杂。

建议
如果监控同一业务，可以选择一套sentinel集群监控多组redis数据节点的方案，反之选择一套sentinel监控一组redis数据节点的方案。
sentinel monitor <master-name> <ip> <port> <quorum> 配置中的<quorum>建议设置成sentinel节点的一半加1，当sentinel部署在多个idc的时候，单个idc部署的sentinel数量不建议超过（sentinel数量 – quorum）。
合理设置参数，防止误切，控制切换灵敏度控制：
a. quorum
b. down-after-milliseconds 30000
c. failover-timeout 180000
d. maxclient
e. timeout

部署的各个节点服务器时间尽量要同步，否则日志的时序性会混乱。
redis建议使用pipeline和multi-keys操作，减少rtt次数，提高请求效率。
自行搞定配置中心（zookeeper），方便客户端对实例的链接访问。

4. redis cluster

redis cluster是社区版推出的redis分布式集群解决方案，主要解决redis分布式方面的需求，比如，当遇到单机内存，并发和流量等瓶颈的时候，redis cluster能起到很好的负载均衡的目的。
redis cluster集群节点最小配置6个节点以上（3主3从），其中主节点提供读写操作，从节点作为备用节点，不提供请求，只作为故障转移使用。
redis cluster采用虚拟槽分区，所有的键根据哈希函数映射到0～16383个整数槽内，每个节点负责维护一部分槽以及槽所印映射的键值数据。

优点
无中心架构；
数据按照slot存储分布在多个节点，节点间数据共享，可动态调整数据分布；
可扩展性：可线性扩展到1000多个节点，节点可动态添加或删除；
高可用性：部分节点不可用时，集群仍可用。通过增加slave做standby数据副本，能够实现故障自动failover，节点之间通过gossip协议交换状态信息，用投票机制完成slave到master的角色提升；
降低运维成本，提高系统的扩展性和可用性。

缺点
client实现复杂，驱动要求实现smart client，缓存slots mapping信息并及时更新，提高了开发难度，客户端的不成熟影响业务的稳定性。目前仅jediscluster相对成熟，异常处理部分还不完善，比如常见的“max redirect exception”。
节点会因为某些原因发生阻塞（阻塞时间大于clutser-node-timeout），被判断下线，这种failover是没有必要的。
数据通过异步复制，不保证数据的强一致性。
多个业务使用同一套集群时，无法根据统计区分冷热数据，资源隔离性较差，容易出现相互影响的情况。
slave在集群中充当“冷备”，不能缓解读压力，当然可以通过sdk的合理设计来提高slave资源的利用率。
key批量操作限制，如使用mset、mget目前只支持具有相同slot值的key执行批量操作。对于映射为不同slot值的key由于keys不支持跨slot查询，所以执行mset、mget、sunion等操作支持不友好。
key事务操作支持有限，只支持多key在同一节点上的事务操作，当多个key分布于不同的节点上时无法使用事务功能。
key作为数据分区的最小粒度，不能将一个很大的键值对象如hash、list等映射到不同的节点。
不支持多数据库空间，单机下的redis可以支持到16个数据库，集群模式下只能使用1个数据库空间，即db 0。
复制结构只支持一层，从节点只能复制主节点，不支持嵌套树状复制结构。
避免产生hot-key，导致主库节点成为系统的短板。
避免产生big-key，导致网卡撑爆、慢查询等。
重试时间应该大于cluster-node-time时间。
redis cluster不建议使用pipeline和multi-keys操作，减少max redirect产生的场景。

5. redis自研

redis自研的高可用解决方案，主要体现在配置中心、故障探测和failover的处理机制上，通常需要根据企业业务的实际线上环境来定制化。

优点
高可靠性、高可用性；
自主可控性高；
贴切业务实际需求，可缩性好，兼容性好。

缺点
实现复杂，开发成本高；
需要建立配套的周边设施，如监控，域名服务，存储元数据信息的数据库等；
维护成本高。

三、redis之redis sentinel（哨兵）实战

1. 实战的项目架构

采用一主（master）二从（slave）三哨兵(sentinel)的架构

2. 将下载的redis复制3分，分别命名如下：

3. 修改三个reids的配置文件

3.1 配置主从

（1）master_6379文件夹中redis.windows.conf文件配置
```
    port 6379
```
（2）slave_6380文件夹中redis.windows.conf文件配置
```
                 port 6380
                 slaveof 127.0.0.1 6379
```
（3）slave_6381文件夹中redis.windows.conf文件配置
```
                 port 6381
                 slaveof 127.0.0.1 6379
```
3.2 哨兵配置
每一个redis目录中都创建一个文sentinel.conf文件
master_6379的sentinel.conf文件配置如下
```
#当前sentinel服务运行的端口
port 26379
#master
#sentinel去监视一个名为mymaster的主redis实例，这个主实例的ip地址为本机地址127.0.0.1，端口号为6379，
#而将这个主实例判断为失效至少需要2个 sentinel进程的同意，只要同意sentinel的数量不达标，自动failover就不会执行
sentinel monitor mymaster 127.0.0.1 6379 1
#指定了sentinel认为redis实例已经失效所需的毫秒数。当 实例超过该时间没有返回ping，或者直接返回错误，那么sentinel将这个实例标记为主观下线。
#只有一个 sentinel进程将实例标记为主观下线并不一定会引起实例的自动故障迁移：只有在足够数量的sentinel都将一个实例标记为主观下线之后，实例才会被标记为客观下线，这时自动故障迁移才会执行
sentinel down-after-milliseconds mymaster 5000
#指定了在执行故障转移时，最多可以有多少个从redis实例在同步新的主实例，在从redis实例较多的情况下这个数字越小，同步的时间越长，完成故障转移所需的时间就越长
sentinel config-epoch mymaster 12
#如果在该时间（ms）内未能完成failover操作，则认为该failover失败
sentinel leader-epoch mymaster 13
```
slave_6380中的sentinel.conf文件配置
```
#当前sentine2服务运行的端口
port 26479
#slave1
sentinel monitor mymaster 127.0.0.1 6379 1
sentinel down-after-milliseconds mymaster 5000
sentinel config-epoch mymaster 12
sentinel leader-epoch mymaster 13
```
slave_6381中的sentinel.conf文件配置
```
#当前sentine3服务运行的端口
port 26579
#slave2
sentinel monitor mymaster 127.0.0.1 6379 1
sentinel down-after-milliseconds mymaster 5000
sentinel config-epoch mymaster 12
sentinel leader-epoch mymaster 13
```
4. 启动服务

编写启动redis脚本
编写一个 bat 来启动 redis，在每个节点目录下建立 startup.bat，内容如下：
```
title master_6379
redis-server.exe redis.windows.conf
```
温馨提示：
（1）title后名称需与reids文件夹名称一致
（2）可以直接运行startup.bat来启动redis，也可以在redis安装目录下用命令redis-server.exe redis.windows.conf直接启动

编写sentinel启动脚本
编写一个 bat 来启动 sentinel，在每个节点目录下建立 startup_sentinel.bat，内容如下：
```
 title master_6379
 redis-server.exe sentinel.conf --sentinel
```
温馨提示：
（1） title命名规则 redis文件夹名, 注意“--sentinel”不是注释，必须存在
（2）另外启动sentinel还可以在redis安装目录下用命令redis-sentinel sentinel.conf 来启动

5. redis服务启动成功

master 6379

slave 6380

slave 6381

6. sentinel服务启动成功

sentinel 26379

sentinel 26479

sentinel 26579

7. 服务查看

7.1 查看redis服务状态,命令: info replication
master 6379

slave 6380

slave 6381

7.2 查看sentinel的状态，命令： info sentinel

8. redis主从自动failover测试

停止master服务器，查看剩余服务器的状态
slave 6380

slave 6381

从上图中可以看出来，master的服务器端口从6379变成了6380，也就是说redis自动的实现了主从切换，
我们可以在查看下sentinel的状态，如下：

我们发现sentinel监控到127.0.0.1:6379已经无法ping通了，切换master服务器为127.0.0.1:6380

温馨提示：在实际操作中，不一定master为6380，可能是6381，具体看当时执行策略。

四、redis之redis cluster（分布式集群）实战

1. 实战的项目架构

（1）3个主节点，建议配置3个从节点，其余3个作为各个主节点的从节点（也是官网推荐的模式），所以需要6台虚拟机。主节点崩溃，从节点的redis就会提升为主节点，代替原来的主节点工作，崩溃的主redis恢复工作后，会再成为从节点
（2）集群
（3）主从复制
（4）哨兵模式
（5）分片

2. 所需软件

（1）redis
（2）ruby语言运行环境
（3）redis的ruby驱动redis-xxxx.gem
（4）创建redis集群的工具redis-trib.rb

3. 下载redis并创建相应集群目录

把 redis 解压后，再复制出 5 份，配置三主三从集群。由于 redis 默认端口号为 6379，那么其它5份的端口可以为6380，6381，6382，6383，6384。并且把目录使用端口号命名

4. 修改配置文件

打开每个redis目录下的文件 redis.windows.conf，修改里面的端口号分别对应相对应的文件夹名：6379、6380、6381、6382、6383、6384，再修改集群支持配置，将以下配置前面的#去掉。
```
cluster-enabled yes
cluster-config-file nodes-6379.conf
cluster-node-timeout 15000
appendonly yes
```
cluster-config-file nodes-6379.conf 是为该节点的配置信息，这里使用 nodes-端口.conf命名方法。服务启动后会在目录生成该文件(为cluster-config-file nodes-文件夹名字.conf)

编写启动脚本，或者进入每个端口命名的文件夹下启动服务，具体可以参考第三的内容
编写一个 bat 来启动 redis，在每个节点目录下建立 startup.bat，内容如下：
```
title redis-6379
redis-server.exe redis.windows.conf
```
温馨提示：title后面为文件夹名称

5. 安装ruby

redis的集群使用 ruby脚本编写，所以系统需要有 ruby 环境 ,下载地址
https://rubyinstaller.org/downloads/

安装时3个选项都勾选。

6. 安装redis的ruby驱动redis-xxxx.gem

下载地址：https://rubygems.org/pages/download

下载后解压，当前目录切换到解压目录中，如 d:\program files\redis_cluster\rubygems-2.7.7 然后命令行执行 ruby setup.rb
再用 gem 安装 redis ：切换到redis安装目录，需要在命令行中，执行 gem install redis

7. 安装集群脚本redis-trib

下载地址 https://raw.githubusercontent.com/antirez/redis/unstable/src/redis-trib.rb
打开该链接把里面的脚本保存为redis-trib.rb，建议保存到一个redis的目录下（不用每个都放），例如放到6379目录下。

温馨提示：现在打开这个链接中的代码已不支持redis 5.0以下的版本了，因为redis5.0以上不再需要redis-trib.rb了，而是使用自带的redis-cli作为创建集群的命令了，老版本的redis-trib.rb可在文章的项目源码与参考资料中进行下载

8. 启动每个节点并且执行集群构建脚本

把每个节点下的 start.bat双击启动，在切换到存放了redis-trib.rb的redis目录在命令行中执行以下内容：
```
redis-trib.rb create --replicas 1 127.0.0.1:6379 127.0.0.1:6380 127.0.0.1:6381 127.0.0.1:6382 127.0.0.1:6383 127.0.0.1:6384
```
温馨提示：
（1）--replicas 1 表示每个主数据库拥有从数据库个数为1。master节点不能少于3个，所以我们用了6个redis
（2）三个主从之间的对应关系由策略进行决定，不一定是6379是主，6380是它的从，但是分配完之后，会有三主三从
（3）如果出现 redis-trib.rb is not longer available! 如果redis版本是5.0以上，则使用如下命令:
```
redis-cli --cluster create 127.0.0.1:6379 127.0.0.1:6380 127.0.0.1:6381 127.0.0.1:6382 127.0.0.1:6383 127.0.0.1:6384 --cluster-replicas 1
```
（4）集群命令创建一次后，以后都不需要再次执行，就算服务器重启都不需要，集群伸缩应该需要

在出现 can i set the above configuration? (type 'yes' to accept): 请确定并输入 yes 。成功后的结果如下：

9. 连接集群进行测试

使用redis客户端redis-cli.exe来查看数据记录数，以及集群相关信息
命令:redis-cli –c –h ”地址” –p "端口号" ; c 表示集群

查看集群的信息，命令：cluster info

查看主从关系，命令： info replication

主库显示信息：

从库显示信息：

查看各个节点分配slot，命令 cluster nodes

可以看到有3个master,3个slave
以及可以看到master各自的slot分布情况

10. redis集群数据分配策略

采用一种叫做哈希槽 (hash slot)的方式来分配数据，redis cluster 默认分配了 16384 个slot，当我们set一个key 时，会用crc16算法来取模得到所属的slot，然后将这个key分到哈希槽区间的节点上，具体算法就是：crc16(key) % 16384
注意的是：必须要3个以上的主节点，否则在创建集群时会失败，三个节点分别承担的slot 区间是：
节点a覆盖0－5460;
节点b覆盖5461－10922;
节点c覆盖10923－16383.

五、java之jedis连接redis（redis cluster版本）

1. 使用idea新建maven项目

创建后的项目结构如下：

2. pom.xml文件添加jar包依赖
```
<?xml version="1.0" encoding="utf-8"?>
<project xmlns="http://maven.apache.org/pom/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/xmlschema-instance"
         xsi:schemalocation="http://maven.apache.org/pom/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelversion>4.0.0</modelversion>

    <groupid>com.wxc</groupid>
    <artifactid>com-redis2</artifactid>
    <version>1.0-snapshot</version>

    <dependencies>

        
        <dependency>
            <groupid>junit</groupid>
            <artifactid>junit</artifactid>
            <version>4.12</version>
        </dependency>

        
        <dependency>
            <groupid>redis.clients</groupid>
            <artifactid>jedis</artifactid>
            <version>2.7.2</version>
        </dependency>

        <dependency>
            <groupid>org.apache.commons</groupid>
            <artifactid>commons-lang3</artifactid>
            <version>3.3.2</version>
        </dependency>

    </dependencies>


</project>
```
3. 新建jedisclustertest.java进行集群连接测试
```
package com.wxc.redis;

import org.junit.test;
import redis.clients.jedis.hostandport;
import redis.clients.jedis.jediscluster;
import redis.clients.jedis.jedispoolconfig;

import java.io.ioexception;
import java.util.hashset;
import java.util.set;

public class jedisclustertest {

    //连接redis集群
    @test
    public void testjediscluster() throws exception {
        //创建一个jediscluster对象
        set<hostandport> nodes = new hashset<hostandport>();
        nodes.add(new hostandport("127.0.0.1", 6379));
        nodes.add(new hostandport("127.0.0.1", 6380));
        nodes.add(new hostandport("127.0.0.1", 6381));
        nodes.add(new hostandport("127.0.0.1", 6382));
        nodes.add(new hostandport("127.0.0.1", 6383));
        nodes.add(new hostandport("127.0.0.1", 6384));
        system.out.println("开始连接redis集群");

        //在nodes中指定每个节点的地址
        //jediscluster在系统中是单例的。
        jediscluster jediscluster = new jediscluster(nodes);

        system.out.println("初始化数据");

        jediscluster.set("name2", "zhangsan");
        jediscluster.set("value2", "100");
        string name = jediscluster.get("name");
        string value = jediscluster.get("value");
        system.out.println(name);
        system.out.println(value);
        //系统关闭时关闭jediscluster
        jediscluster.close();
    }
}
```
4. 运行项目

5. 测试集群故障转移与主从备份

5.1 查看主从关系

从图中我们可以看出，6379，6381，6383是主节点，其他是从节点

5.2 测试故障自动转移
现在我们将6381的服务断开，之后再查看一次服务

我们可以看到这两个服务已经挂了，之后我们再次运行java项目，这次我们把key改为name3、value3

再次运行java项目

可以看到集群数据操作成功

5.3 查看集群自动主从备份
现在我们用redis客户端工具打开连接，进行数据查看，我们可以看到name3和value3都插入成功了

刚刚我们的6381服务是关闭的，我们现在重新打开，再看看6381数据是否会自动同步

打开之后，我们发现其数据已经自动同步

七、项目源码与资料下载

链接：https://pan.baidu.com/s/1wcwcxo-qeffvb9ujcjrvma
提取码：pe01

八、参考文章

上一篇： MyBatis从入门到精通(二)：MyBatis XML方式的基本用法之Select

下一篇： MySQL(十一)--MySQL主从复制

Redis之高可用、集群、云平台搭建

文章大纲

一、基础知识学习

二、redis常见的几种架构及优缺点总结

1. redis单副本

2. redis多副本（主从）

3. redis sentinel（哨兵）

4. redis cluster

5. redis自研

三、redis之redis sentinel（哨兵）实战

1. 实战的项目架构

2. 将下载的redis复制3分，分别命名如下：

3. 修改三个reids的配置文件

4. 启动服务

5. redis服务启动成功

6. sentinel服务启动成功

7. 服务查看

四、redis之redis cluster（分布式集群）实战

1. 实战的项目架构

2. 所需软件

3. 下载redis并创建相应集群目录

4. 修改配置文件

5. 安装ruby

6. 安装redis的ruby驱动redis-xxxx.gem

7. 安装集群脚本redis-trib

8. 启动每个节点并且执行集群构建脚本

9. 连接集群进行测试

10. redis集群数据分配策略

五、java之jedis连接redis（redis cluster版本）

1. 使用idea新建maven项目

2. pom.xml文件添加jar包依赖

3. 新建jedisclustertest.java进行集群连接测试

4. 运行项目

5. 测试集群故障转移与主从备份

七、项目源码与资料下载

八、参考文章

三分钟快速搭建分布式高可用的Redis集群

Redis Cluster搭建高可用Redis服务器集群

Redis5之后版本的高可用集群搭建的实现

mongodb3.4集群搭建实战之高可用的分片+副本集

Redis之高可用、集群、云平台搭建

详解三分钟快速搭建分布式高可用的Redis集群

Linux Redis分布式集群 Redis cluster高可用集群的搭建部署

三分钟快速搭建分布式高可用的Redis集群

Redis Cluster搭建高可用Redis服务器集群

mongodb3.4集群搭建实战之高可用的分片+副本集