当前位置: 首页 > news >正文

Pulsar存储计算分离架构设计之Broker无状态

一、前言

在分布式消息队列系统中,传统的架构模式如RocketMQ、RabbitMQ和Kafka等,通常将消息存储和消息处理逻辑集中在Broker节点上。这种模式虽然在一定程度上简化了系统设计,但在面对大规模数据处理和高并发访问时,会面临一些挑战,如单点故障、数据一致性、负载均衡以及扩展性等问题。为了解决这些问题,Apache Pulsar提出了一种全新的架构设计——存储计算分离。

二、Pulsar的存储计算分离的优势

2.1 存储与计算职责分离

Pulsar将消息的存储职责从Broker中剥离出来,交由专门的BookKeeper集群负责。BookKeeper集群采用分布式存储方式,确保消息数据的高可靠性和持久性。而Broker则专注于消息的处理和分发,不再承担存储任务,从而成为无状态节点。

2.2 灵活的负载均衡

由于Broker是无状态的,Pulsar可以根据集群的负载情况动态调整Broker与主题分区的对应关系。当某个Broker负载过高时,可以将其管理的部分分区迁移到其他负载较低的Broker上,从而实现负载均衡。这种动态调整机制大大简化了集群的管理和调度。

2.3 简化的故障恢复

在传统的消息队列系统中,如果某个Broker节点发生故障,需要找到与该节点数据一致的节点来接管其任务,这通常是一个复杂且耗时的过程。而在Pulsar中,由于Broker是无状态的,任何一个Broker都可以接管发生故障的Broker的任务,无需进行数据同步和一致性检查,从而大大简化了故障恢复过程。

2.4 易于扩展和维护

由于存储和计算职责的分离,Pulsar可以独立地扩展Broker集群和BookKeeper集群。当系统需要处理更多的消息时,可以简单地增加Broker节点来提高处理能力;当需要存储更多的消息时,可以增加BookKeeper节点来扩展存储空间。这种独立的扩展方式使得系统的维护和升级变得更加简单和高效。

2.5 高性能与可靠性

BookKeeper集群通过复制和分片技术确保消息数据的高可靠性和持久性。同时,Broker通过缓存机制减少对BookKeeper集群的访问频率,提高消息处理的性能。这种设计使得Pulsar在保持高性能的同时,也具备了极高的可靠性。

综上所述,Pulsar的存储计算分离架构通过将存储和计算职责分离,实现了灵活的负载均衡、简化的故障恢复、易于扩展和维护以及高性能与可靠性等特点。这种架构设计为分布式消息队列系统的发展提供了新的思路和方向。

三、Pulsar的存储计算分离的缺点

3.1 问题的本质未变

俗话说,“背着抱着一样沉”。在系统设计中,无论是否采用存储计算分离,系统需要完成的功能和解决的问题本质上是相同的。例如,在Pulsar中,尽管Broker相比于其他消息队列的Broker变得更加简单,但这并不意味着存储计算分离的设计解决了所有复杂问题。实际上,这些问题只是被转移到了BookKeeper存储集群上。

3.2 存储集群的复杂性

BookKeeper作为存储集群,依然需要解决数据一致性、节点故障转移、选举、数据复制等一系列复杂问题。因此,存储计算分离后,系统从单个集群变为两个集群,整体复杂度实际上有所增加。

3.3 性能损失

存储计算分离设计也会导致系统性能的一定损失。例如,在Pulsar中,当客户端从Broker消费一条消息时,Broker需要向BookKeeper集群请求数据,然后再返回给客户端。这个过程增加了网络传输和内存拷贝的次数,相比于直接从本地磁盘读取数据,性能会有所下降。

尽管存储计算分离会带来一定的性能损失,但相比于其带来的优点(如降低系统开发复杂度、提高系统的可扩展性和可维护性等),这种性能损失是可以接受的。特别是对于大部分业务系统来说,采用存储计算分离设计是非常划算的选择。

综上所述,存储计算分离设计在系统设计中具有其独特的优势和局限性。在决定是否采用这种设计时,需要综合考虑系统的具体需求、性能要求以及开发复杂度等因素。

四、Pulsar的生产者与消费者流程

4.1 Producer实例化

在这里插入图片描述

4.2 Producer发送消息

在这里插入图片描述

4.3 Consumer实例化

在这里插入图片描述

4.4 Consumer接收消息

在这里插入图片描述

五、Broker 模块

前置的一些分析我就大概说下,无非还是那一套,Client 与 Server 通过 Netty 进行通信,PulsarDecoder 包装了下,继承自 Netty 的 ChannelInboundHandlerAdapter (入站事件处理器的适配器类)

在这里插入图片描述

可以看下 继承 Netty 那一套的 UML 图:

在这里插入图片描述
跟着源码可以看到这个方法:

org.apache.pulsar.broker.service.ServerCnx#handleSend

在这里插入图片描述
关键逻辑说明:

在这里插入图片描述
主要看 producer.publishMessage :

在这里插入图片描述
在这里插入图片描述

我们这里直接看持久化主题的,继续跟 publishMessage:

在这里插入图片描述

Broker 无状态的核心体现,也是Pulsar的存储计算分离架构的核心体现之一,这里很重要,划重点!!!

在这里插入图片描述

Broker 无状态的主要时序图:

在这里插入图片描述

消息从客户端到 Broker 的完整路径:

  • Broker 内部的处理流程(Producer → ServerCnx → Topic → ManagedLedger)
  • BookKeeper 写入机制(OpAddEntry → BookKeeper → Bookie)
  • 回调机制(addComplete → publishContext.completed)
  • 最终客户端收到确认
http://www.dtcms.com/a/293192.html

相关文章:

  • vscode目录,右键菜单加入用VSCode打开文件和文件夹(快速解决)(含删除)(脚本)
  • gma视角的历史地图集3:自夏至宋3000年5座洛阳城
  • 【锁】MySQL中有哪几种锁?
  • opencv-图像处理
  • 视频编解码技术的未来趋势:从H.266到AI驱动的绿色革命
  • 【AI 学习笔记】Tool Calling:让 AI 不再“纸上谈兵“
  • 深入解析 Fetch API 的 credentials 属性:Cookie 携带机制
  • 洛谷 P3478 [POI 2008] STA-Station
  • Ollama Docker 容器向容器内传输AI模型并挂载模型
  • 基于快速S变换的配电网故障选线
  • Android开发:Java与Kotlin深度对比
  • IDC权威认可:瑞数信息双项入选《中国大模型安全保护市场概览》
  • CSS+JavaScript 禁用浏览器复制功能的几种方法
  • AWE2026启动:加码AI科技,双展区联动开启产业新格局
  • LeetCode 刷题【11. 盛最多水的容器】
  • Zap日志库指南
  • PCIe Base Specification解析(三)
  • java多线程编程自用笔记
  • 论文笔记:EMR-MERGING: Tuning-Free High-Performance Model Merging
  • 2025.7.22 测试 总结
  • Qt/C++源码/监控设备模拟器/支持onvif和gb28181/多路批量模拟/虚拟监控摄像头
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | ImageCarousel(图片轮播组件)
  • linux应用:spi_ioc_transfer结构cs_change说明
  • 【实时Linux实战系列】实时文件系统的特性与优化
  • 深入解析Hadoop中的Region分裂与合并机制
  • Adam、AdamW介绍,以及AdamW优势
  • 数控机床上滚珠螺杆故障怎么解决?
  • HITL节点介绍(Human-in-the-loop nodes)(指在自动化流程(如AI工作流或系统)中,允许人类在关键步骤直接参与、干预或修正的节点)
  • 【Verilog】竞争、冒险
  • 11.Java三大特性