初识RedisCluster集群
-
需要提高更大的并发量
-
redis官方提出拥有10万qps的请求量
-
如果业务需要redis拥有100万的qps
-
可以通过集群来提升并发量。
-
-
需要存储更大的数据量
-
一般服务器的机器内存为16g-256g
-
如果业务需要500g的数据量
-
可以通过集群的分区技术来扩展数据量
-
数据分区
1.顺序分区
例如一共有编号为1~100的100条数据,一共有3个分区abc,则需要预先设计
-
1~33号数据落入a分区
-
34~66号数据落入b分区
-
67~100号数据落入c分区
2.哈希分区
hash(key) % node_count
3.顺序分区 vs 哈希分区
分布方式 | 特点 | 典型产品 |
---|---|---|
哈希分布 | 数据分散度高 键值分布与业务无关 无法顺序访问 | 一致性哈希memcache redis cluster 其他缓存产品 |
顺序分布 | 数据分散度易倾斜 键值分布与业务有关 可顺序访问 | bigtable hbase |
哈希分区
1.节点取余分区
-
含义:hash(key) % node_count
-
优点:hash+取余的方式计算节点的分区很简单
-
缺点:当节点伸缩时候,数据节点关系发生变化,导致数据迁移
-
扩容的时候建议翻倍扩容,可以降低数据的迁移量。
2.一致性哈希分区
-
含义:哈希+顺时针(优化取余)
-
约定长度232位的哈希环,在其中分布若干个hash点。
-
第一步对每个key做哈希处理得到hashval
-
第二步将hashval顺时针偏移,得到的第一个hash点,即为分区的落点
-
-
优点:节点伸缩的时候,只会影响邻近节点,但是还是会有数据迁移
-
翻倍的伸缩,可以保证最小的迁移数据且达到数据的负载均衡
-
3.虚拟槽分区
-
预设虚拟槽,每个槽映射一个数据子集,一般比节点数大
-
采用crc16(key) & 16383来决定节点
-
每个节点顺序地平均分布16384个槽,即当有5个节点时
-
a 0 ~ 3276
-
b 3277 ~ 6553
-
c 6554 ~ 9830
-
d 9831 ~ 13107
-
e 13108 ~ 16383
-
rediscluster架构
一、节点
由多个master主节点组成,各个master都负责去读写,每个master都有各自的slave节点。
二、gossip协议
多个master节点之间会使用gossip协议进行通信
1.meet消息
用于通知新节点加入。消息发送者通知接收者加入到当前集群,meet消息通信正常完成后,接收节点会加入到集群中并进行周期性的ping、pong消息交换。
当a meet b以及a meet c之后,b就可以与c做交互了
2.ping消息
集群中交换最频繁的消息,集群内各个节点每秒向多个其他节点发送ping消息,用于检测节点是否在线和交换彼此状态信息。
ping消息发送封装了自身节点和部分其他节点的状态数据。
3.pong消息
当接收到ping、meet消息时,作为响应消息回复给发送方确认消息正常通信。
pong消息内部封装了自身状态数据。
节点也可以向集群内广播自身的pong消息来通知整个集群对自身状态进行更新
4.fail消息
当节点判定集群内另一个节点下线时,会向集群内广播一个fail消息,其他节点接收到fail消息之后把对应节点更新诶下线状态
三、指派槽
需要为rediscluster指派槽,指定各个master节点的槽范围,让它进行正常的读写
四、复制
每个master节点包含若干个slave节点,形成主从复制的形式,以提高高可用性。
通过各个节点之间相互监控来达到sentinel的目的
rediscluster安装
rediscluster主要配置
命令 | 含义 |
---|---|
cluster-enabled yes | 节点是否开启集群模式 |
cluster-node-timeout 15000 | 节点主观下线超时时间,毫秒 |
cluster-config-file "nodes.conf" | 集群配置文件 |
cluster-require-full-coverage no | 是否需要所有节点全都可用,集群才能对外服务,此处推荐设置为no |
一、原生命令安装
1.配置开启节点
port : 7000、7001、7002、7003、7004、7005
port ${port}
daemonize yes
dir "/redisdatapath"
dbfilename "dump-${port}.rdb"
logfile "${port}.log"
cluster-enabled yes
cluster-config-file nodes-${port}.conf
2.meet
cluster meet ip port
#例如在7000端口上依次执行
cluster meet 127.0.0.1 7001
cluster meet 127.0.0.1 7002
cluster meet 127.0.0.1 7003
cluster meet 127.0.0.1 7004
cluster meet 127.0.0.1 7005
3.指派槽
cluster addslots slot [slot...]
#可以通过编写脚本shell方便实现
#addslot.sh
port=$1
start=$2
end=$3
for slot in `seq ${start} ${end}`
do
echo "slot:${slot}"
redis-cli -p ${port} cluster addslots ${slot}
done
#
./addslot.sh 7000 0 5461
./addslot.sh 7001 5462 10922
./addslot.sh 7002 10922 16383
4.设置主从
#可以在任一节点上执行cluster nodes命令查看所有节点的node_id等信息
redis-cli -p 7000 cluster nodes
#在从节点上执行以下操作表示复制master节点
cluster replicate node-id
#
redis-cli -h 127.0.0.1 -p 7003 cluster replicate ${node-id-7000}
redis-cli -h 127.0.0.1 -p 7004 cluster replicate ${node-id-7001}
redis-cli -h 127.0.0.1 -p 7005 cluster replicate ${node-id-7002}
二、官方工具安装
./redis-trib.rb create --replicas 1 127.0.0.1:8000 127.0.0.1:8001
127.0.0.1:8002 127.0.0.1:8003 127.0.0.1:8004 127.0.0.1:8005
# 1 代表每个master有1个slave
# 此时,一共6个节点,每个master有1个slave,即前3个会形成master节点,后3个会形成slave节点
三、原生命令 vs redis-trib.rb
优点 | 缺点 | |
---|---|---|
原生命令 | 易于理解redis cluster架构 | 生产环境不使用,太麻烦,容易犯错 |
redis-trib.rb | 高效,准确 生产环境可以使用 |