zookeeper watch机制的理解
首先我们看看为什么添加watch。
zookeeper是用来协调(同步)分布式进程的服务,提供了一个简单高性能的协调内核,用户可以在此之上构建更多复杂的分布式协调功能。
多个分布式进程通过zookeeper提供的 api 来操作共享的zookeeper内存数据对象znode来达成某种一致的行为或结果,这种模式本质上是基于状态共享的并发模型,与java的多线程并发模型一致,他们的线程或进程都是“共享式内存通信”。java没有直接提供某种响应式通知接口来监控某个对象状态的变化,只能要么浪费cpu时间毫无响应式的轮询重试,或基于java提供的某种主动通知(notif)机制(内置队列)来响应状态变化,但这种机制是需要循环阻塞调用。而zookeeper实现这些分布式进程的状态(znode的data、children)共享时,基于性能的考虑采用了类似的异步非阻塞的主动通知模式即watch机制,使得分布式进程之间的“共享状态通信”更加实时高效,其实这也是zookeeper的主要任务决定的—协调。
所有的zookeeper读操作,包括getdata()、getchildren()和exists(),都有一个开关,可以在操作的同时再设置一个watch。在zookeeper中,watch是一个一次性触发器,会在被设置watch的数据发生变化的时候,发送给设置watch的客户端。watch的定义中有三个关键点:
一次性触发器
一个watch事件将会在数据发生变更时发送给客户端。例如,如果客户端执行操作getdata(“/znode1″, true),而后/znode1 发生变更或是删除了,客户端都会得到一个/znode1 的watch事件。如果/znode1 再次发生变更,则在客户端没有设置新的watch的情况下,是不会再给这个客户端发送watch事件的。
发送给客户端
这就是说,一个事件会发送给客户端,但可能在操作成功的返回值到达发起变动的客户端之前,这个事件还没有送达watch的客户端。watch是异步发送的。但zookeeper保证了一个顺序:一个客户端在收到watch事件之前,一定不会看到它设置过watch的值的变动。网络时延和其他因素可能会导致不同的客户端看到watch和更新返回值的时间不同。但关键点是,每个客户端所看到的每件事都是有顺序的。
被设置了watch的数据
这是指节点发生变动的不同方式。你可以认为zookeeper维护了两个watch列表:data watch和child watch。getdata()和exists()设置data watch,而getchildren()设置child watch。或者,可以认为watch是根据返回值设置的。getdata()和exists()返回节点本身的信息,而getchildren()返回子节点的列表。因此,setdata()会触发znode上设置的data watch(如果set成功的话)。一个成功的?create() 操作会触发被创建的znode上的数据watch,以及其父节点上的child watch。而一个成功的?delete()操作将会同时触发一个znode的data watch和child watch(因为这样就没有子节点了),同时也会触发其父节点的child watch。
watch由client连接上的zookeeper服务器在本地维护。这样可以减小设置、维护和分发watch的开销。当一个客户端连接到一个新的服务器上时,watch将会被以任意会话事件触发。当与一个服务器失去连接的时候,是无法接收到watch的。而当client重新连接时,如果需要的话,所有先前注册过的watch,都会被重新注册。通常这是完全透明的。只有在一个特殊情况下,watch可能会丢失:对于一个未创建的znode的exist watch,如果在客户端断开连接期间被创建了,并且随后在客户端连接上之前又删除了,这种情况下,这个watch事件可能会被丢失。?
zookeeper对watch提供了什么保障
对于watch,zookeeper提供了这些保障:
watch与其他事件、其他watch以及异步回复都是有序的。zookeeper客户端库保证所有事件都会按顺序分发;客户端会保障它在看到相应的znode的新数据之前接收到watch事件;从zookeeper接收到的watch事件顺序一定和zookeeper服务所看到的事件顺序是一致的。
关于watch的一些值得注意的事情
watch是一次性触发器,如果你得到了一个watch事件,而你希望在以后发生变更时继续得到通知,你应该再设置一个watch。
因为watch是一次性触发器,而获得事件再发送一个新的设置watch的请求这一过程会有延时,所以你无法确保你看到了所有发生在zookeeper上的一个节点上的事件。所以请处理好在这个时间窗口中可能会发生多次znode变更的这种情况。(你可以不处理,但至少请认识到这一点)。
一个watch对象或一个函数/上下文对,为一个事件只会被通知一次。比如,如果同一个watch对象在同一个文件上分别通过exists和getdata注册了两次,而这个文件之后被删除了,这时这个watch对象将只会收到一次该文件的deletion通知。
当你从一个服务器上断开时(比如服务器出故障了),在再次连接上之前,你将无法获得任何watch。请使用这些会话事件来进入安全模式:在disconnected状态下你将不会收到事件,所以你的程序在此期间应该谨慎行事。
总结
以上就是本文关于zookeeper watch机制的全部介绍,有兴趣的朋友可以参阅:、等,希望对大家有所帮助。