消息队列系列(一)关于RocketMQ双主架构的设计思考

295次阅读  |  发布于2年以前

最近在整理一些关于消息队列相关的知识点,所以开启了现在这个篇目。

本篇主要从RocketMQ的整体设计进行入手分析,不会有太过多源码层面的讲解,尽量通过一些图文的方式来带大家深入理解RocketMQ内部的一些设计细节。

ps:关于如何使用RocketMQ发送和消费消息的部分这里就直接略过了,这些比较基础的入门级别内容大家可以直接到RocketMQ的官网上去学习了解。下边是对应的官网地址:

https://rocketmq.apache.org/docs/motivation/

如果要设计一款消息组件,你会如何设计它的基本架构

在开始介绍RocketMQ的网络拓扑图之前,我们先从原始的设计开始构思,如果要让我们手动编码实现一款消息平台的产品,那么需要考虑哪些点?下边给出一些我个人的思考:

如何理解消息队列?

随着互联网流量的日渐爆发,高吞吐,高可用,高性能已经成了每个互联网公司内部都会遇到一个难题,而消息队列也是在互联网爆发之后所催生的一种产品

ps: 其实很早的时候在操作系统的内部也有消息队列的设计,它被作为了进程间通信的方式之一,感兴趣的小伙伴可以去了解下System V消息队列的设计。

相关设计的原理图大致如下:

更多底层细节可以去查看这篇文章,本文中就不做过多扩展:

https://www.cnblogs.com/Anker/archive/2013/01/07/2848869.html

消息队列在企业中落地的设计目的:

解耦:降低微服务间系统调用的强耦合问题

削峰:解决高并发请求对业务下游的冲击

异步:可以适用于一些异步场景

最终一致性:保证消息的消费结果能够达到最终一致。

参考Linux内核的消息队列设计,下边给出基于分布式环境部署的消息队列设计思路:

Version 1 单消息承载节点部署版本

思考:如果消息承载点挂了怎么办?这没法解决高可用问题啊。

Version 2 多消息承载节点部署版本

消息发送方往多个消息承载点发送同一条数据,保证单个节点挂了之后,还会有节点可以用于承载消息,然后consumer从消息承载点获取消息。

思考:多个承载点之间的数据一致性该如何解决?

通常解决这类设计问题的主要方案就是选出一个leader角色,所以不妨可以尝试使用主从的思维去设计优化。

Version 3 多消息承载节点+主从部署版本

加入了主从关系之后,消息承载点的支撑能力开始有所提升,consumer可以从主节点和从节点读取消息,这样能保证两种情况下消息消费的可靠性:

思考:通常我们的主从集群部署都会存放在一个机柜内部从而降低网络延迟,但是如果一旦出现了机房断电,那么整个集群都会挂掉,该如何避免这类情况?

Version 4 多消息承载节点+多主从部署版本

Producer发送消息的时候往两个主节点去写入,两套主从分别部署在不同的机柜,这样保证即使断电了也不影响线上业务的使用。

思考:面对这么多的消息承载点,producer怎么知道消息该发送给哪个ip呢?当承载点挂了,producer又该如何跟换发送消息的目标地址呢?

Version 5 多消息承载节点+多主从部署+注册中心版本

所有的消息承载节点都将地址信息上报到注册中心(集群部署)中,produer发送消息的时候聪注册中心获取需要发送消息的承载点地址即可。另外消息承载点需要和注册中心定期上报健康数据,保证节点的高可用性。consumer也是从注册中心获取所有消息承载点的地址信息。

目前来看似乎可以将这套设计方案落地到实际企业应用中了。如果你看懂了上边几个版本的消息队列演进设计图,那么再来看下RocketMQ的集群部署网络拓扑图就不会觉得复杂了。

RocketMQ网络拓扑图

图中的NameServer其实就是我在前边提到的注册中心这个概念,Broker可以理解为我在前边提到的消息承载点概念。

下边是我从Github上摘选的一段关于RocketMQ集群部署架构模式下的描述:

RocketMQ 网络部署特点

结合部署架构图,描述集群工作流程:

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8