什么是ZooKeeper?
前言
只有光头才能变强。
文本已收录至我的github仓库,欢迎star:https://github.com/zhongfucheng3y/3y
上次写了一篇 什么是消息队列?以后,本来想入门一下kafka的(装一下环境、看看kafka一些概念啥的)。后来发现kafka用到了zookeeper,而我又对zookeeper不了解,所以想先来学学什么是zookeeper,再去看看什么是kafka。
zookeeper相信大家已经听过这个词了,不知道大家对他了解多少呢?我第一次听到zookeeper的时候是在学eureka的时候(外行人都能看懂的springcloud,错过了血亏!),同样zookeeper也可以作为注册中心。
后面听到zookeeper的时候,是因为zookeeper可以作为分布式锁的一种实现。
直至在了解kafka的时候,发现kafka也需要依赖zookeeper。kafka使用zookeeper管理自己的元数据配置。
这篇文章来写写我学习zookeeper的笔记,如果有错的地方希望大家可以在评论区指出。
一、什么是zookeeper
从上面我们也可以发现,好像哪都有zookeeper的身影,那什么是zookeeper呢?我们先去官网看看介绍:
官网还有另一段话:
zookeeper: a distributed coordination service for distributed applications
相比于官网的介绍,我其实更喜欢wiki中对zookeeper的介绍:
(留下不懂英语的泪水)
我简单概括一下:
- zookeeper主要服务于分布式系统,可以用zookeeper来做:统一配置管理、统一命名服务、分布式锁、集群管理。
- 使用分布式系统就无法避免对节点管理的问题(需要实时感知节点的状态、对节点进行统一管理等等),而由于这些问题处理起来可能相对麻烦和提高了系统的复杂性,zookeeper作为一个能够通用解决这些问题的中间件就应运而生了。
二、为什么zookeeper能干这么多?
从上面我们可以知道,可以用zookeeper来做:统一配置管理、统一命名服务、分布式锁、集群管理。
- 这里我们先不管
统一配置管理、统一命名服务、分布式锁、集群管理
每个具体的含义(后面会讲)
那为什么zookeeper可以干那么多事?来看看zookeeper究竟是何方神物,在wiki中其实也有提到:
zookeeper nodes store their data in a hierarchical name space, much like a file system or a tree data structure
zookeeper的数据结构,跟unix文件系统非常类似,可以看做是一颗树,每个节点叫做znode。每一个节点可以通过路径来标识,结构图如下:
那zookeeper这颗"树"有什么特点呢??zookeeper的节点我们称之为znode,znode分为两种类型:
- 短暂/临时(ephemeral):当客户端和服务端断开连接后,所创建的znode(节点)会自动删除
- 持久(persistent):当客户端和服务端断开连接后,所创建的znode(节点)不会删除
zookeeper和redis一样,也是c/s结构(分成客户端和服务端)
2.1 监听器
在上面我们已经简单知道了zookeeper的数据结构了,zookeeper还配合了监听器才能够做那么多事的。
常见的监听场景有以下两项:
- 监听znode节点的数据变化
- 监听子节点的增减变化
没错,通过监听+znode节点(持久/短暂[临时]),zookeeper就可以玩出这么多花样了。
三、zookeeper是怎么做到的?
下面我们来看看用zookeeper怎么来做:统一配置管理、统一命名服务、分布式锁、集群管理。
3.1 统一配置管理
比如我们现在有三个系统a、b、c,他们有三份配置,分别是asystem.yml、bsystem.yml、csystem.yml
,然后,这三份配置又非常类似,很多的配置项几乎都一样。
- 此时,如果我们要改变其中一份配置项的信息,很可能其他两份都要改。并且,改变了配置项的信息很可能就要重启系统
于是,我们希望把asystem.yml、bsystem.yml、csystem.yml
相同的配置项抽取出来成一份公用的配置common.yml
,并且即便common.yml
改了,也不需要系统a、b、c重启。
做法:我们可以将common.yml
这份配置放在zookeeper的znode节点中,系统a、b、c监听着这个znode节点有无变更,如果变更了,及时响应。
参考资料:
- 基于zookeeper实现统一配置管理
3.2 统一命名服务
统一命名服务的理解其实跟域名一样,是我们为这某一部分的资源给它取一个名字,别人通过这个名字就可以拿到对应的资源。
比如说,现在我有一个域名www.java3y.com
,但我这个域名下有多台机器:
- 192.168.1.1
- 192.168.1.2
- 192.168.1.3
- 192.168.1.4
别人访问www.java3y.com
即可访问到我的机器,而不是通过ip去访问。
3.3 分布式锁
锁的概念在这我就不说了,如果对锁概念还不太了解的同学,可参考下面的文章
我们可以使用zookeeper来实现分布式锁,那是怎么做的呢??下面来看看:
系统a、b、c都去访问/locks
节点
访问的时候会创建带顺序号的临时/短暂(ephemeral_sequential
)节点,比如,系统a创建了id_000000
节点,系统b创建了id_000002
节点,系统c创建了id_000001
节点。
接着,拿到/locks
节点下的所有子节点(id_000000,id_000001,id_000002),判断自己创建的是不是最小的那个节点
- 如果是,则拿到锁。
- 释放锁:执行完操作后,把创建的节点给删掉
- 如果不是,则监听比自己要小1的节点变化
举个例子:
- 系统a拿到
/locks
节点下的所有子节点,经过比较,发现自己(id_000000
),是所有子节点最小的。所以得到锁 - 系统b拿到
/locks
节点下的所有子节点,经过比较,发现自己(id_000002
),不是所有子节点最小的。所以监听比自己小1的节点id_000001
的状态 系统c拿到
/locks
节点下的所有子节点,经过比较,发现自己(id_000001
),不是所有子节点最小的。所以监听比自己小1的节点id_000000
的状态- …...
- 等到系统a执行完操作以后,将自己创建的节点删除(
id_000000
)。通过监听,系统c发现id_000000
节点已经删除了,发现自己已经是最小的节点了,于是顺利拿到锁 ….系统b如上
3.4集群状态
经过上面几个例子,我相信大家也很容易想到zookeeper是怎么"感知"节点的动态新增或者删除的了。
还是以我们三个系统a、b、c为例,在zookeeper中创建临时节点即可:
只要系统a挂了,那/groupmember/a
这个节点就会删除,通过监听groupmember
下的子节点,系统b和c就能够感知到系统a已经挂了。(新增也是同理)
除了能够感知节点的上下线变化,zookeeper还可以实现动态选举master的功能。(如果集群是主从架构模式下)
原理也很简单,如果想要实现动态选举master的功能,znode节点的类型是带顺序号的临时节点(ephemeral_sequential
)就好了。
- zookeeper会每次选举最小编号的作为master,如果master挂了,自然对应的znode节点就会删除。然后让新的最小编号作为master,这样就可以实现动态选举的功能了。
最后
这篇文章主要讲解了zookeeper的入门相关的知识,zookeeper通过znode的节点类型+监听机制就实现那么多好用的功能了!
当然了,zookeeper要考虑的事没那么简单的,后面有机会深入的话,我还会继续分享,希望这篇文章对大家有所帮助~
参考资料:
- 分布式服务框架 zookeeper
- zookeeper初识整理(老酒装新瓶)
- zookeeper
- zookeeper 的应用场景
乐于输出干货的java技术公众号:java3y。公众号内有200多篇原创技术文章、海量视频资源、精美脑图,不妨来关注一下!
觉得我的文章写得不错,不妨点一下赞!