欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

想使用消息队列,先考虑下这些问题!

程序员文章站 2022-07-09 21:12:59
原创:Java派(微信公众号:Java派),欢迎分享,转载请保留出处。 消息队列优势 消息队列(Message Queue,简称MQ),其主要用于在复杂的微服务系统中进行消息通信,它的优点可以大致整理成以下几点: 1. 服务间解耦 2. 提高服务并发、性能 3. 突发流量削峰 4. ... 服务间解 ......

原创:java派(微信公众号:java派),欢迎分享,转载请保留出处。

消息队列优势

消息队列(message queue,简称mq),其主要用于在复杂的微服务系统中进行消息通信,它的优点可以大致整理成以下几点:

  1. 服务间解耦
  2. 提高服务并发、性能
  3. 突发流量削峰
  4. ...

服务间解耦

微服务系统业务之间相互依赖,各种调用错综复杂,如果不能良好对服务进行解耦那一个服务的可用性、并发都会受到其他服务的影响。

在没有引用mq的之前服务调用大概是这些步骤:

想使用消息队列,先考虑下这些问题!

图上的a服务是直接调用的,这是没啥问题的,但是服务上线后要迭代更新的麻,这个时候要是服务c的开发人员有点代码小洁癖说:我这个c服务接口命名不太好,我需要重新更新下,当a服务的小哥哥还戴着小耳机听着小歌曲,突然就得改代码了~~。

后来负责服务c的那小哥哥也不好意思了,提出大家一起使用mq吧,于是a、c的调用就变成下面这个样子了:

想使用消息队列,先考虑下这些问题!

服务a不直接调用c而是向消息队列中发送消息(生产者),另一边的c取出队列中的消息(消费者)进行处理,这样a、c就完成了解耦。

提高服务并发、性能

举个例子,在没引入mq之前服务调用多个服务都是同步调用,比如像这样:

想使用消息队列,先考虑下这些问题!

服务a要顺序的调用b、c服务来完成业务逻辑如果a->b需要200ms,a->c需要200ms,再加上自身业务逻辑处理可能需要花费500ms,其中有400ms是调用a和b的花费,明明自身100ms就能处理完还白白浪费400ms,不能忍啊于是可以引入mq做一下改造:

想使用消息队列,先考虑下这些问题!

这下有了mq,a服务只需要发一条消息比如花费50ms,再加上自身业务逻辑的100ms,那整个调用过程只需要花费150ms了,这样对并发和性能都有一定的改善。

突发流量削峰

突发流量就是互联网很常见的情况,有时候有热点、突发事件,那平常qps为100的接口,突然提升10-20倍这个时候没有mq所有流量直接进入服务,这对服务和数据库都是很大的挑战:

想使用消息队列,先考虑下这些问题!

再次引入mq就情况就不一样了,服务a先将请求丢给mq,然后可以慢慢消费掉:

想使用消息队列,先考虑下这些问题!

消息队列带来的一些问题

使用mq还有很多好处,但是他也会带一些麻烦事。首先就是会降低系统的可用性,比如mq挂了怎么办呢?所以在引入mq之前就需要考虑之后带来的哪些问题,不能只看它的好处也需要考虑它不好的地方。比如下面列出的这些问题要如果解决:

  1. 如何保证消息队列的高可用?
  2. 如何保证消息不被重复消费?
  3. 如何保证消息不丢失?
  4. 如何保证消息的消费顺序?

下面我们来分析下这些问题。

如何保证消息队列的高可用?

如果是单机消息队列,一台机器挂了消息队列都就不用了,这是不能接受的,如果是一个消息队列群集,一台机器挂了还有其他机器能正常提供服务,所以要保证消息队列的高可用,我们就需要做消息队列集群。

以rabbitmq为例它有两种集群模式:

  1. 普通模式
  2. 镜像模式

普通模式

普通模式,rabbitmq会同步各个节点的数据/状态,但不包括消息队列,默认情况下,消息队列驻留在一个节点上,尽管它们在所有节点上都是可见且可访问的。

想使用消息队列,先考虑下这些问题!

在这种模式下,每个节点都有会所有节点的元数据信息,所以当发送消息到队列时,无论连接的是哪一个节点都能正确的发送,但是节点只会同步其他节点的元数据,消息队列的数据还是在一个节点上,如果这个节点挂了那就意味着发消息就会失败,无法保证消息队列的高可用。

镜像模式

默认情况下,rabbitmq中queue与binding、exchange不一样,它只会存于声明队列的节点中,但是可以选择使queue跨多个节点进行镜像。

每一个镜像队列由一个master和一个或多个镜像组成,任何队列的的操作,都会先应用到master节点上然后传播到多个镜像节点。如果master节点挂了,最老的镜像节点将会成为新的master节点。

想使用消息队列,先考虑下这些问题!

总结

rabbitmq有两种集群方法:普通模式镜像模式,要实现消息队列的高可用可以选一种合适的集群方式来达到,关于rabbitmq的集群搭建方式,由于篇幅有限这里就不多说,可自行查看 distributed rabbitmq文章。

如何保证消息不被重复消费?

想象下消费者收到重复的消息会发生什么情况,比如订单支付消息,如果支付服务收到两条重复的消息让用户去支付两次,那用户肯定是不愿意的,明明已经支付过了还要支付。

想使用消息队列,先考虑下这些问题!

如上图中第四步消费消息b的时候失败了,如果支付服务在做完业务之后,发送ack之前服务挂了,mq没有收到ack,由于消息还存在队列中,服务恢复正常后会再次收到消息,如果支付不做检查那用户就会发生两次支付。

要避免这个重复消费的问题,可以在消费端引入内存、redis、数据库来保存消息消费记录,根据消息id来判断消息是否已经被消费过。

如何保证消息不丢失?

假设有订单服务和支付服务,正常流程是用户下单成功,然后向支付服务发送支付消息,这里面就涉及订单服务、支付服务、mq的交互了,消息丢失可以分为三种情况:

  1. 生产者消息丢失
  2. mq消息丢失
  3. 消费者消息丢失

生产者消息丢失

生产者消息丢失,可以使用本地消息表解决、消息确认/重发等方式来解决。以rabbitmq为例,它有confirm机制,发出去的消息是否入队列,会使用回调的形式告知生产者,生产者收到消息后判断是ack还是nak,如果是nak则重发消息。

想使用消息队列,先考虑下这些问题!

此时还会有问题,如果极端情况下订单服务挂了,再次重启后消息就真丢失了,所以最好还是在生产中对消息做持久化,待订单服务恢复后使用job重新发送消息。

mq消息丢失

mq消息丢失一般为未开启持久化,mq挂了再次重启后消息丢失,所以应当将消息持久化到磁盘中。如果mq收到消息后在同步到磁盘之前mq挂了,那磁盘中也没有消息,这样还是会导致消息丢失消息,不过这只是小概率事件。

消费者消息丢失

消费者消息丢失,大都为开启了autoack选项,消费者收到消息后还未完成处理,此时服务挂了,由于开启了autoack, mq会以为此消息已经被成功消费,将消息从队列中移除,而服务恢复过后也不会收到原来的消息了。

如果保证消息的消费顺序?

有些场景下要保持消息的顺序消费怎么办?比如写log都是一条条打印出来,如果发到消息队列后出现消费顺序不一致那消息的那日志就会乱掉,给看日志的人带来不必要的麻烦。比如为了加快日志的处理速度使用三个消费都处理日志:

想使用消息队列,先考虑下这些问题!

按图上的流程,消费者a、b、c可能分别消费日志1、2、3,这时候就无法保证消息的处理顺序。要保证消息的消费顺序,首先让消息都发送到同一个队列,然后使用一个消费者去处理消息:

想使用消息队列,先考虑下这些问题!

这样消息的处理速度就大大降低,要保持消息的顺序,则又想让消息的处理速度不至于太慢,可以引用本地队列:

想使用消息队列,先考虑下这些问题!