欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

消息中间件——RabbitMQ(二)各大主流消息中间件综合对比介绍!

程序员文章站 2022-12-21 23:28:41
前言 消息队列已经逐渐成为企业IT系统内部通信的核心手段。它具有低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能,成为异步RPC的主要手段之一。当今市面上有很多主流的消息中间件,如老牌的ActiveMQ、RabbitMQ,炙手可热的Kafka,阿里巴巴自主开发RocketMQ等。今天主要来介 ......

消息中间件——RabbitMQ(二)各大主流消息中间件综合对比介绍!

消息中间件——RabbitMQ(二)各大主流消息中间件综合对比介绍!

前言

消息队列已经逐渐成为企业it系统内部通信的核心手段。它具有低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能,成为异步rpc的主要手段之一。当今市面上有很多主流的消息中间件,如老牌的activemq、rabbitmq,炙手可热的kafka,阿里巴巴自主开发rocketmq等。今天主要来介绍了下几大主流消息中间件的区别与联系。

1. 主流消息中间件介绍——activemq

activemq是由apache出品,activemq是一个完全支持jms1.1和j2ee 1.4规范的jms provider实现。它非常快速,支持多种语言的客户端和协议,而且可以非常容易的嵌入到企业的应用环境中,并有许多高级功能。

1.1 特点

  • activemq是apache出品,最流行的,能力强劲的开源消息总线,并且它是一个完全支持jms规范的消息中间件
  • 其丰富的api、多种集群构建模式使得他成为业界老牌消息中间件,在中小型企业中应用广泛!
  • mq衡量指标:服务性能、数据存储、集群架构。

activemq现在用的比较少,因为activemq相比其他的mq的性能来说比较一般。现如今高并发、大数据的应用场景随处可见。如果这时候在mq的选择上,那么activemq就显得力不从心了。

衡量一个mq的指标,主要有三个方面:服务性能、数据存储、集群架构
服务性能:activemq的性能不是特别好,面对超大规模并发时候,总是会出现各种各样的小问题,比如阻塞,消息堆积过多,产生一些延迟等等一些问题。
数据存储:activemq默认采用kahadb内存存储方式。也可以采用一些高性能的存储方式,比如:google的leveldb 基于内c存的。如果是为了保证消息的可靠,也可以采用mysql或者oracle数据库。
集群架构:activemq流行那么多年,与其他组件集成的api也是十分完善的。如果不是特别大的并发场景下,activemq也是一个不错的选择。因为activemq的集群架构模式也是十分好。

1.2 架构模式

消息中间件——RabbitMQ(二)各大主流消息中间件综合对比介绍!

masrer-slave模式
主备模式,利用zookeeper进行两个或多个节点的协调。其中的主节点是对外提供服务的,而另外的从节点启动着,但是不对外提供服务。当主节点挂掉,利用zookeeper进行一个高可用的切换,将salve节点切换成主节点,继续对外提供服务。

network模式

本质是两组主备模式的集成,中间用newwork网关,做一个连接配置,就可以实现分布式集群。

1.3 小结

优点:

  • 跨平台(java编写与平台无关,activemq几乎可以运行在任何的jvm上)
  • 可以用jdbc:可以将数据持久化到数据库。虽然使用jdbc会降低activemq的性能,但是数据库一直都是开发人员最熟悉的存储介质
  • 支持jms规范:支持jms规范提供的统一接口
  • 支持自动重连和错误重试机制
  • 有安全机制:支持基于shiro,jaas等多种安全配置机制,可以对queue/topic进行认证和授权
  • 监控完善:拥有完善的监控,包括webconsole,jmx,shell命令行,jolokia的restful api
  • 界面友善:提供的webconsole可以满足大部分情况,还有很多第三方的组件可以使用,比如hawtio

缺点:

  • 社区活跃度不及rabbitmq高
  • 根据其他用户反馈,会出莫名其妙的问题,会丢失消息
  • 目前重心放到activemq6.0产品apollo,对5.x的维护较少
  • 不适合用于上千个队列的应用场景

2. 主流消息中间件介绍——kafka

apache kafka是一个分布式消息发布订阅系统。它最初由linkedin公司基于独特的设计实现为一个分布式的日志提交系统(a distributed commit log),之后成为apache项目的一部分。kafka性能高效、可扩展良好并且可持久化。它的分区特性,可复制和可容错都是其不错的特性。

2.1 特点

kafka是linkedin开源的分布式发布-定于消息系统,目前归属于apache*项目。kafka主要特点是给予pull的模式来处理消费消息,追求高吞吐量,一开始的目的就是用于日志收集和传输。0.8版本开始支持复制,不支持事务,对消息的重复、丢失、错误没有严格要求,适合产生大量数据的互联网服务的数据收集业务。这里可以看出kafka只关注吞吐量。因此,在使用kafka的时候,注意业务是否允许消息重复、丢失、错误等。如果允许的话,kafka是最合适的。因为它的性能是最高的。即使在廉价的服务器上,也能支持单机每秒100k条以上的数据量。所以说它的性能是非常好的。kafka仅仅使用内存进行存储,只要有足够的内存,就能够足够大的吞吐量。因为kafka并没有在磁盘上进行读写。

  • 快速持久化:可以在o(1)的系统开销下进行消息持久化;
  • 高吞吐:在一台普通的服务器上既可以达到10w/s的吞吐速率;
  • 完全的分布式系统:broker、producer和consumer都原生自动支持分布式,自动实现负载均衡;
  • 支持同步和异步复制两种高可用机制;
  • 支持数据批量发送和拉取;
  • 零拷贝技术(zero-copy):减少io操作步骤,提高系统吞吐量;
  • 数据迁移、扩容对用户透明;
  • 无需停机即可扩展机器;
  • 其他特性:丰富的消息拉取模型、高效订阅者水平扩展、实时的消息订阅、亿级的消息堆积能力、定期删除机制

2.2 架构模式

kafka架构模式

消息中间件——RabbitMQ(二)各大主流消息中间件综合对比介绍!

主要依赖zookeeper进行协调管理,每一个kafka可以进行副本复制,也就是数据同步。假如说:有一条数据落在第一个节点上,那么就会进行repilicate 复制,这样在运行中每个节点就有一份数据,一共就有三分数据。如果说其中一台宕机,也能从另外两个节点中获取数据。部署方案建议:跨机房部署。即使有一台机子宕机,在数据上也是没有问题的。如果在整个地点宕机了。那么我们的数据也就丢失了。这也是大公司需要考虑的异地灾备。当然kafka主要关注性能的,对于数据的可靠性关注并高。

2.3 小结

优点:

  • 客户端语言丰富:支持java、.net、php、ruby、python、go等多种语言;
  • 高性能:单机写入tps约在100万条/秒,消息大小10个字节;
  • 提供完全分布式架构,并有replica机制,拥有较高的可用性和可靠性,理论上支持消息无限堆积;
  • 支持批量操作;
  • 消费者采用pull方式获取消息。消息有序,通过控制能够保证所有消息被消费且仅被消费一次;
  • 有优秀的第三方kafkaweb管理界面kafka-manager;
  • 在日志领域比较成熟,被多家公司和多个开源项目使用。

缺点:

  • kafka单机超过64个队列/分区时,load时会发生明显的飙高现象。队列越多,负载越高,发送消息响应时间变长;
  • 使用短轮询方式,实时性取决于轮询间隔时间;
  • 消费失败不支持重试;
  • 支持消息顺序,但是一台代理宕机后,就会产生消息乱序;
  • 社区更新较慢。

3. 主流消息中间件介绍——rocketmq

rocketmq是阿里开源的消息中间件,目前也已经孵化为apache*项目。用java语言实现,在设计时参考了kafka,并做出了自己的一些改进,消息可靠性上比kafka更好。rocketmq在阿里内部被广泛应用在订单,交易,充值,流计算,消息推送,日志流式处理,binglog分发等场景。

3.1 特点

核心的特点如下:

  • 保证消息的顺序性,消息按顺序消费。
  • 提供了丰富的拉取和处理模式。
  • 高效的订阅者,也可以进行水平扩展。
  • 承载上亿级别的消息堆积能力。

3.2 架构模式

rocketmq集群架构模式
1.master-slave(主从)模式
2.双master模式。
3.双主双从模式。
4.多主多从模式。
5.一主多从模式。
可选方案许多种可供选择。

等等,参考了许多开源的设方式。

集群拓扑

消息中间件——RabbitMQ(二)各大主流消息中间件综合对比介绍!

阿里觉得zookeeper性能太低,自己搭建了nameserver,这个nameserver代码也十分精简,一共也就几百行代码。有兴趣可以去读源码。

3.3 小结

优点:

  • 单机支持1万以上持久化队列;
  • rocketmq的所有消息都是持久化的,先写入系统pagecache,然后刷盘,可以保证内存与磁盘都有一份数据,而访问时,直接从内存读取。
  • 模型简单,接口易用(jms的接口很多场合并不太实用);
  • 性能非常好,可以允许大量堆积消息在broker中;
  • 支持多种消费模式,包括集群消费、广播消费等;
  • 各个环节分布式扩展设计,支持主从和高可用;
  • 开发度较活跃,版本更新很快。

缺点:

  • 支持的 客户端语言不多,目前是java及c++,其中c++还不成熟
  • 维护rocketmq需要专业的团队
  • 商业版收费,有许多功能是不对外提供的。
  • 没有在mq核心里实现jms等接口

4. 为什么选择rabbitmq?

1.activemq,性能不是很好,因此在高并发的场景下,直接被pass掉了。它的api很完善,在中小型互联网公司可以去使用。
2.kafka,主要强调高性能,如果对业务需要可靠性消息的投递的时候。那么就不能够选择kafka了。但是如果做一些日志收集呢,kafka还是很好的。因为kafka的性能是十分好的。
3.rocketmq,它的特点非常好。它高性能、满足可靠性、分布式事物、支持水平扩展、上亿级别的消息堆积、主从之间的切换等等。mq的所有优点它基本都满足。但是它最大的缺点:商业版收费。因此它有许多功能是不对外提供的。

那么说完这三种mq还有没有其他mq能够选择呢?有的,也是这次学习的mq——rabbitmq。

5. 主流消息中间件介绍——rabbitmq

rabbitmq于2007年发布,是一个在amqp(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。

5.1 特点

rabbitmq是使用erlang语言开发的开源消息队列系统,基于amqp协议来实现。
amqp的主要特征是面向消息、队列、路由(包括点对点和发布/订阅)、可靠性、安全。
amqp协议更多用在企业系统内,对数据一致性、稳定性和可靠性要求很高的场景,对性能和吞吐量的要求还在其次。
rabbitmq的可靠性是非常好的,数据能够保证百分之百的不丢失。可以使用镜像队列,它的稳定性非常好。所以说在我们互联网的金融行业。对数据的稳定性和可靠性要求都非常高的情况下,我们都会选择rabbitmq。当然没有kafka性能好,但是要比avtivemq性能要好很多。也可以自己做一些性能的优化。
rabbitmq可以构建异地双活架构,包括每一个节点存储方式可以采用磁盘或者内存的方式。

rabbitmq的集群架构

消息中间件——RabbitMQ(二)各大主流消息中间件综合对比介绍!

图中说的就是,我们可以采用三个节点作为rabbitmq的一组集群,当然可以有许多组。节点与节点之间采用mirror queue。基于这种方式,能够保证数据百分之百的不丢失。
前端可以去做负载均衡,比如负载均衡组件:ha-proxy ,进行tcp级别的负载。
如果想做一个高可用的话,就需要借助keepalived做一个高可用的配置。
比如前端加一个虚拟的vip,通过vip路由到指定的负载均衡组件,再有它路由到rabbtmq的某一个节点。
这就是整个rabbitmq集群架构。
能够实现非常完善,高可用并且性能也十分好,稳定性超强。并且有各种集群恢复手段。
比如:某一个节点挂了,或者某个磁盘损坏了,它也能进行一个消息修复。基于这么多优点,我们一定要把rabbitmq学好。

6. 对比分析图

消息中间件——RabbitMQ(二)各大主流消息中间件综合对比介绍!

图片来自网络~

文末

本章节主要简单介绍了数据库中乐观锁与悲观锁的相关知识,后续我们将会继续介绍数据库中的其他锁以及相关知识。例如行锁、表锁、死锁、

欢迎关注个人微信公众号:coder编程
获取最新原创技术文章和免费学习资料,更有大量精品思维导图、面试资料、pmp备考资料等你来领,方便你随时随地学习技术知识!
新建了一个qq群:315211365,欢迎大家进群交流一起学习。谢谢了!也可以介绍给身边有需要的朋友。

文章收录至
github: https://github.com/codermerlin/coder-programming
gitee:
欢迎关注并star~
消息中间件——RabbitMQ(二)各大主流消息中间件综合对比介绍!

参考文章:

https://my.oschina.net/blogbyrzc/blog/3012251

《rabbitmq消息中间件精讲》

推荐文章:

rabbitmq(一)windows/linux环境搭建(完整版)