欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

消息队列概念与认知

程序员文章站 2022-03-26 10:52:46
本文是-消息队列学习的概念与介绍篇。目的是能够对消息队列能够有一个简单的了解和大体的认知。 包括一系列参考资料的整理。 消息队列 MQ(message queue)中间件是分布式系统中的重要组件,主要解决异步消息、应用解耦、流量 削峰等问题,从而实现高性能、高可用 ,可伸缩和最终一致性的架构。 使... ......

本文是-消息队列学习的概念与介绍篇。目的是能够对消息队列能够有一个简单的了解和大体的认知。

参考/学习资料整理(好东西要学会分享 )

b站上的黑马activemq的视频教程

hollis公众号上的消息队列文章

架构之家公众号上的消息队列文章

javaguide(一份涵盖大部分java程序员所需要掌握的核心知识的文档类项目)

cs-notes(技术面试必备基础知识)

jcsprout(处于萌芽阶段的 java 核心知识库)

一个在线绘图的工具

一、消息队列简介

消息队列 mq(message queue)中间件是分布式系统中的重要组件,主要解决异步消息、应用解耦、流量 削峰等问题,从而实现高性能、高可用 ,可伸缩和最终一致性的架构。

使用较多的消息队列有activemq 、rabbitmq、rocketmq、kafka、metamq等

1 消息队列应用场景分析

1.1 异步处理

举个栗子:

有这样一个用户注册场景 ,实现将注册信息写入数据库并发送邮件和注册短信的功能。

传统的方式如图:

消息队列概念与认知

这样的方式会一步步按照先后顺序 完成后返回给用户信息 ,整个过程用户都处于等待的状态,并用时150ms。

而引用消息对列 ,异步处理,改造后的架构如下

消息队列概念与认知

这样对于用户的响应时间就大大减少了。

1.2 应用解耦

多应用间通过消息队列对同一消息进行处理,避免调用接口失败导致整个过程失败。

消息队列概念与认知

1.3 流量削峰

广泛应用于秒杀或抢购活动中,避免流量过大导致应用系统挂掉的情况。

具体场景:购物网站开展秒杀活动,一般由于瞬时访问量过大,服务器接收过大,会导致流量暴增,相关系统无法处理请求甚至崩溃。而加入消息队列后,系统可以从消息队列中取数据,相当于消息队列做了一次缓冲。

二、jms & amqp

1 jms 简介

jms(java message service,java消息服务)是java的消息服务,jms的客户端之间可以通过jms服务进行异步的消息传输。jms(java message service,java消息服务)api是一个消息服务的标准或者说是规范,允许应用程序组件基于javaee平台创建、发送、接收和读取消息。它使分布式通信耦合度更低,消息服务更加可靠以及异步性。

activemq 就是基于 jms 规范实现的。

2 jms 消息模型

2.1 p2p(point to point)点对点模式

p2p模式包含三个角色:消息队列(queue)、发送者(sender)、接收者(receiver)。每个消息都被发送到一个特定的队列,接收者从队列中获取消息。队列保留消息 ,直到他们被消费或超时。

消息队列概念与认知

p2p的特点:

  • 每个消息只有一个消费者(consumer)(即一旦被消费,消息就不再在消息队列中)。
  • 发送者和接收者之间在时间上没有依赖性,也就是说当大发送者发送了消息之后,不管接收者有没有正在运行 ,他不会影响到消息被发送到队列。
  • 接收者在成功接收消息之后需向队列应答成功。

如果希望发送的每个消息都会被成功处理的话,那么需要p2p模式。

2.2 publish/subscribe(pub/sub)发布订阅模式

pub/sub模式包含三个角色:主题(topic)、发布者(publisher)、订阅者(subscriber)。多个 发布者将消息发布到topic,系统将这些消息传递给多个订阅者。

消息队列概念与认知

pub/sub的特点:

  • 每个消息可以有多个消费者。
  • 发布者和订阅者之间没有时间上的依赖性,针对某个主题(topic)的订阅者,他必须创建一个订阅之后,才能消费发布者的消息。
  • 为了消费消息,订阅者必须保持运行的状态。[为了缓和这样严格的时间相关性,jms允许订阅者创建一个可持久化的订阅。这样即使订阅者没有被激活(运行),它也能收到发布者发布的消息。]

如果希望发送的消息可以被多个消费者处理的话,那么可以采用pub/sub模型。

2.3 jms 五种不同的正文消息格式

jms定义了五种不同的消息正文格式,以及调用的消息类型,允许你发送并接收以一些不同形式的数据,提供现有消息格式的一些级别的兼容性。

  • streammessage -- java原始值的数据流
  • mapmessage--一套名称-值对
  • textmessage--一个字符串对象
  • objectmessage--一个序列化的 java对象
  • bytesmessage--一个字节的数据流

3 amqp

3.1 amqp简介

amqp,即advanced message queuing protocol,一个提供统一消息服务的应用层标准 高级消息队列协议(二进制应用层协议),是应用层协议的一个开放标准,为面向消息的中间件设计,兼容 jms。基于此协议的客户端与消息中间件可传递消息,并不受客户端/中间件同产品,不同的开发语言等条件的限制。

rabbitmq 就是基于 amqp 协议实现的。

4 jms与amqp对比

对比方向 jms amqp
定义 java api 协议
跨语言
跨平台
支持消息类型 提供两种消息模型:①peer-2-peer;②pub/sub 提供了五种消息模型:①direct exchange;②fanout exchange;③topic change;④headers exchange;⑤system exchange。本质来讲,后四种和jms的pub/sub模型没有太大差别,仅是在路由机制上做了更详细的划分;
支持消息类型 支持多种消息类型 ,我们在上面提到过 byte[](二进制)

总结:

  • amqp 为消息定义了线路层(wire-level protocol)的协议,而jms所定义的是api规范。在 java 体系中,多个client均可以通过jms进行交互,不需要应用修改代码,但是其对跨平台的支持较差。而amqp天然具有跨平台、跨语言特性。
  • jms 支持textmessage、mapmessage 等复杂的消息类型;而 amqp 仅支持 byte[] 消息类型(复杂的类型可序列化后发送)。
  • 由于exchange 提供的路由算法,amqp可以提供多样化的路由方式来传递消息到消息队列,而 jms 仅支持 队列 和 主题/订阅 方式两种。

三、常见消息队列对比总结

对比方向 概要
吞吐量 万级的 activemq 和 rabbitmq 的吞吐量(activemq 的性能最差)要比 十万级甚至是百万级的 rocketmq 和 kafka 低一个数量级。
可用性 都可以实现高可用。activemq 和 rabbitmq 都是基于主从架构实现高可用性。rocketmq 基于分布式架构。 kafka 也是分布式的,一个数据多个副本,少数机器宕机,不会丢失数据,不会导致不可用
时效性 rabbitmq 基于erlang开发,所以并发能力很强,性能极其好,延时很低,达到微秒级。其他三个都是 ms 级。
功能支持 除了 kafka,其他三个功能都较为完备。 kafka 功能较为简单,主要支持简单的mq功能,在大数据领域的实时计算以及日志采集被大规模使用,是事实上的标准
消息丢失 activemq 和 rabbitmq 丢失的可能性非常低, rocketmq 和 kafka 理论上不会丢失。

总结:

  • activemq 的社区算是比较成熟,但是较目前来说,activemq 的性能比较差,而且版本迭代很慢,不推荐使用。
  • rabbitmq 在吞吐量方面虽然稍逊于 kafka 和 rocketmq ,但是由于它基于 erlang 开发,所以并发能力很强,性能极其好,延时很低,达到微秒级。但是也因为 rabbitmq 基于 erlang 开发,所以国内很少有公司有实力做erlang源码级别的研究和定制。如果业务场景对并发量要求不是太高(十万级、百万级),那这四种消息队列中,rabbitmq 一定是你的首选。如果是大数据领域的实时计算、日志采集等场景,用 kafka 是业内标准的,绝对没问题,社区活跃度很高,绝对不会黄,何况几乎是全世界这个领域的事实性规范。
  • rocketmq 阿里出品,java 系开源项目,源代码我们可以直接阅读,然后可以定制自己公司的mq,并且 rocketmq 有阿里巴巴的实际业务场景的实战考验。rocketmq 社区活跃度相对较为一般,不过也还可以,文档相对来说简单一些,然后接口这块不是按照标准 jms 规范走的有些系统要迁移需要修改大量代码。还有就是阿里出台的技术,你得做好这个技术万一被抛弃,社区黄掉的风险,那如果你们公司有技术实力我觉得用rocketmq 挺好的
  • kafka 的特点其实很明显,就是仅仅提供较少的核心功能,但是提供超高的吞吐量,ms 级的延迟,极高的可用性以及可靠性,而且分布式可以任意扩展。同时 kafka 最好是支撑较少的 topic 数量即可,保证其超高吞吐量。kafka 唯一的一点劣势是有可能消息重复消费,那么对数据准确性会造成极其轻微的影响,在大数据领域中以及日志采集中,这点轻微影响可以忽略这个特性天然适合大数据实时计算以及日志收集。

四、更多参考资料汇总[粘贴狂魔 (﹁"﹁)(﹁"﹁)(﹁"﹁)]

1 消息队列:

  1. 大型网站架构之分布式消息队列
  2. 消息队列的使用场景
  3. 浅谈异步消息队列模型
  4. 消息队列的两种模式

2 rabbitmq

  1. rabbitmq主页
  2. rabbitmq学习教程
  3. 专栏:rabbitmq从入门到精通
  4. rabbitmq能为你做些什么
  5. rabbitmq指南(1)-特性及功能

3 activemq

  1. activemq主页
  2. apache activemq介绍
  3. activemq的简介与安装
  4. activemq 和消息简介

4 rocketmq

  1. 主页 https://github.com/alibaba/rocketmq
  2. rocketmq 原理简介 http://alibaba.github.io/rocketmq-docs/document/design/rocketmq_design.pdf
  3. rocketmq与kafka对比(18项差异)

5 kafka

  1. kafka主页:
  2. kafka特性
  3. kafka客户端支持语言 https://cwiki.apache.org/confluence/display/kafka/clients

6 rabbitmq/activemq/rocketmq/kafka对比

  1. rocketmq,队列选型
  2. rabbitmq和kafka
  3. 即时通信rabbitmq二-性能测试
  4. rabbitmq、activemq、zeromq、kafka之间的比较,资料汇总
  5. 消息队列软件产品大比拼