欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  资讯频道

Disque:Redis作者新开发的消息队列

程序员文章站 2022-03-07 19:20:55
...
[刘江/文]Redis的作者Salvatore Sanfilippo(网名Antirez)今天发表了一篇新博客文章,详细介绍了自己几个月以来在晚上和周末开发的新项目——Disque。这个项目今年1月份Antirez曾经在邮件列表中透露过,现在看来已经离正式发布不远了。

Disque是一个分布式的消息队列。与Redis有单结点和分布式模式不同,单一Disque结点也是只有一个结点的集群。它是一个AP系统,也就是具有Availability(可用性)和Partition tolerance(分区容错性)。另外它能在各种情形下保持高扩展性:无论是多生产者和多消费者处理多队列,还是所有生产者和消费者都在一个队列。

另外,Disque的设计中有一点重大牺牲,就是只尽力提供而不保证消息的排序。

Antirez还通过回答Adrian Colyer(AspectJ的作者,曾任SpringSource CTO,后来有人指出,Antirez记错了,这些问题是Jacques Chester提出的)在Hacker News上某次讨论(但这一讨论没有查到)中所提问题的方式,更详细地描述了Disque的特性:
  • 消息发送可以选择至少一次或者最多一次。
  • 消息需要消费者确认。
  • 如果没有确认,会一直重发,直至到期。确认信息会广播给拥有消息副本的所有结点,然后消息会被垃圾收集或者删除。
  • 队列是持久的。
  • Disque默认只运行在内存里,持久性是通过同步备份实现的。
  • 队列为了保证最大吞吐量,不是全局一致的,但会尽力提供排序。
  • 在压力大的时候,消息不会丢弃,但会拒绝新的消息。
  • 消费者和生产者可以通过命令查看队列中的消息。
  • 队列尽力提供FIFO。
  • 一组master作为中介,客户端可以与任一结点通信。
  • 中介有命名的队列,无需消费者和生产者干预。
  • 消息发送是事务性的,保证集群中会有所需数量的副本。
  • 消息接收不是事务性的。
  • 消费者默认是接收时是阻塞的,但也可以选择查看新消息。
  • 生产者在队列满时发新消息可以得到错误信息,也可以让集群异步地复制消息。
  • 支持延迟作业,粒度是秒,最久可以长达数年。但需要消耗内存。
  • 消费者和生产者可以连接不同的结点。

开发初衷

Antirez之所以动念开发Disque,是因为看到很多人用Redis来处理队列,但这样做的优势和劣势都很明显:Redis很快、易用而且很多基础设施里已经在用;但是Redis的高可用性/集群特性的设计完全偏向可变数据结构,这与不可变的消息非常不同,并非最佳方案。

消息中介重要的功能是保证至少一次或者最多一次发送消息,而且前者更重要。Antirez开始想通过少量修改Redis来实现,但几天后发现客户端算法太复杂了。Redis已经有很多功能,再增加功能并非什么好主意。何况消息队列的运作方式与Redis很不同。

那么,是不是可以新开发一个消息队列呢?

世界上已经有很多消息队列了,新做一个有价值吗?Antirez想,既然有这么多人用Redis来处理消息队列,已有的方案看上去要么太简单要么太复杂,其中必有机会,于是他动手了。

开发过程

他头一次没有直接上来就写代码,而是花了几个星期思考设计,尝试从用户角度理解什么样的消息队列会让人更爽。主要的使用场景没变:延迟作业。Disque是通用系统,但主要针对的问题,是发送可能要处理的作业的消息。如果有什么违背了这一场景,就会被干掉。

设计有了,Antirez直接从Redis代码入手。幸运的是Redis部分就是编写C分布式系统的一个框架。协议、网络库、客户端处理、结点到结点的消息总线已经有了,无需重头再写。但他又不想影响Redis本身,于是采取了比较实际的办法:开一个Redis分支,然后将Redis专用的东西全部删掉,只剩一个框架,再开始实现设计。

到目前为止,他已经完成了80%左右的工作,还剩下AOF硬盘持久性没做,此外还需要对API做一些改善。

让我们期待他尽快放出代码吧。

Hacker News上Parse.ly的CTO Andrew Montalenti(@pixelmonkey )将Disque和Kafka做了比较:

引用
设计上AP和部分排序都很类似。但Disque会在发送完成后垃圾收集数据,而Kafka在SLA/TTL中保持所有消息,允许重新处理。Disque在服务器端处理最多一次,而Kafka是由客户端处理的。


Blekko的工程副总Chuck Mcmanis(@ChuckMcM)也给出了自己的经验:

引用
开发这样的系统,我的建议是:永远不要依赖时间,总是假设至少一次,而且开发内置的错误检查和更正机制,这样在消息协议里有两个或者多个不变量违反时,可以从消息流中计算出正确结果。


本文来自刘江的博客
相关标签: Disque redis