当前位置: 首页 > wzjs >正文

网站建设公司河南广州新一期lpr

网站建设公司河南,广州新一期lpr,wordpress子目录伪静态,wordpress科技公司主题1. 引言 Apache Kafka 是一个高性能、分布式的消息系统,其核心设计依赖于 Broker、分片(Partition) 和 副本(Replica) 的协同工作。Broker 作为 Kafka 集群的基本服务单元,负责管理分片和副本的存储、同步…

1. 引言

Apache Kafka 是一个高性能、分布式的消息系统,其核心设计依赖于 Broker分片(Partition)副本(Replica) 的协同工作。Broker 作为 Kafka 集群的基本服务单元,负责管理分片和副本的存储、同步、故障恢复等关键任务。本文将深入探讨 Kafka Broker 如何管理分片和副本,以及其背后的机制。


2. Kafka Broker 的基本职责

Kafka Broker 是 Kafka 集群中的服务器节点,每个 Broker 负责:

  • 存储分片数据(Partition)
  • 处理生产者和消费者的读写请求
  • 维护副本同步
  • 参与 Leader 选举
  • 监控集群状态

Broker 之间通过 ZooKeeper(旧版本)或 KRaft(新版本) 进行协调,确保数据一致性和高可用性。


3. 分片(Partition)与副本(Replica)

3.1 分片(Partition)

  • Kafka 的 Topic 被划分为多个 分片(Partition),每个分片是一个有序、不可变的消息队列。
  • 分片允许 Kafka 水平扩展,提高并行处理能力。

3.2 副本(Replica)

  • 每个分片可以有 多个副本(由 replication.factor 配置,通常为 3)。
  • 副本分为:
    • Leader 副本:处理所有读写请求。
    • Follower 副本:从 Leader 异步拉取数据,保持同步。

副本分布在不同的 Broker 上,以提高容错能力。


4. Broker 如何管理分片和副本

4.1 副本分配策略

当创建一个 Topic 时,Kafka 会自动分配分片副本到不同的 Broker,遵循以下原则:

  1. 同一分片的副本不能放在同一个 Broker(避免单点故障)。
  2. 尽量均衡 Leader 副本分布(避免某些 Broker 负载过高)。
  3. 支持机架感知(Rack Awareness)(副本分布在不同的机架,提高容灾能力)。

4.2 Leader/Follower 机制

  • Leader 副本

    • 处理所有生产者和消费者的读写请求。
    • 负责推进 高水位(High Watermark, HW),表示已提交(committed)的消息偏移量。
  • Follower 副本

    • 定期从 Leader 拉取数据(fetch 请求)。
    • 如果 Follower 落后太多,会被移出 ISR(In-Sync Replicas) 列表。

4.3 ISR(In-Sync Replicas)

  • ISR 是当前与 Leader 保持同步的副本集合。
  • 只有 ISR 中的副本才有资格被选为新的 Leader。
  • 如果 Follower 长时间未同步(replica.lag.time.max.ms 超时),会被移出 ISR。

4.4 高水位(HW)与 LEO(Log End Offset)

  • LEO(Log End Offset):表示副本最新写入的消息偏移量。

  • HW(High Watermark):表示所有 ISR 副本都已确认的消息偏移量(消费者只能读到 HW 之前的消息)。

    例如:

    Leader LEO = 10
    Follower1 LEO = 8
    Follower2 LEO = 9
    => HW = 8(所有副本都确认到 8)
    

4.5 请求处理流程

  1. 生产者发送消息

    • 请求发送到 Leader 副本。
    • Leader 写入本地日志,并等待 ISR 副本确认。
    • 当所有 ISR 副本确认后,HW 推进,返回 ack 给生产者。
  2. 消费者读取消息

    • 消费者只能读取 HW 之前的消息(确保数据一致性)。
    • 如果请求发送到 Follower,会被重定向到 Leader。

4.6 Leader 选举

  • 当 Leader 副本宕机时,Controller Broker 会从 ISR 中选举新的 Leader。
  • 如果没有可用的 ISR 副本,Kafka 可能会:
    • 等待副本恢复(unclean.leader.election.enable=false,默认)。
    • 选择非 ISR 副本(unclean.leader.election.enable=true,可能丢失数据)。

4.7 副本同步机制

Follower 副本通过 拉取(fetch) 请求从 Leader 同步数据:

  • 周期性拉取fetch.min.bytesfetch.wait.max.ms 控制频率)。
  • HW 更新:只有当所有 ISR 副本都确认消息后,HW 才会推进。

4.8 故障恢复

  • Broker 宕机

    • Controller 检测到 Broker 下线,触发 Leader 重新选举。
    • 恢复后,副本会从 Leader 重新同步缺失的数据。
  • 副本滞后(Lagging Replica)

    • 如果 Follower 长时间未同步,会被移出 ISR。
    • 恢复后,会从 Leader 重新同步数据(可能触发 Log Truncation,丢弃不一致的数据)。

5. 磁盘存储管理

Broker 对分片的存储采用 日志分段(Log Segments) 策略:

  • 每个分片的数据被拆分为多个 segment 文件(默认 1GB)。
  • 每个 segment 包含:
    • .log 文件(存储消息)
    • .index 文件(偏移量索引)
    • .timeindex 文件(时间戳索引)
  • 日志清理策略
    • delete(默认):基于时间或大小删除旧数据。
    • compact:仅保留每个 key 的最新值(适用于 KV 存储场景)。

6. Controller Broker 的特殊角色

Kafka 集群中有一个 Broker 会被选举为 Controller,负责:

  • 监控 Broker 状态(通过 ZooKeeper/KRaft)。
  • 管理 Leader 选举(当 Leader 宕机时,从 ISR 中选择新 Leader)。
  • 处理分片重新分配(如 kafka-reassign-partitions 命令)。
  • 维护集群元数据(如 Topic、Broker、分片信息)。

7. 总结

Kafka Broker 通过 分片、副本、Leader/Follower 机制、ISR、HW/LEO 等设计,实现了:
高吞吐量(分片并行处理)
高可用性(副本容错)
数据一致性(HW 机制)
自动故障恢复(Leader 选举)

理解 Broker 如何管理分片和副本,有助于优化 Kafka 集群配置,提高稳定性和性能。

http://www.dtcms.com/wzjs/384621.html

相关文章:

  • 汕头网站建设技术支持代发广告平台
  • 做缓网站网推
  • 国外网站问题软文营销的经典案例
  • 网站建设方案书的内容网络推广公司哪家好
  • 快速做网站的方法厨师培训学校
  • wordpress菜单小图标关于进一步优化
  • wordpress开发的主流架构搜狗seo刷排名软件
  • 烟台网站制作步骤直通车怎么开
  • wordpress获取分类的文章列表seo排名工具给您好的建议下载官网
  • 海丰网站建设百度搜索指数在线查询
  • 网站开发如何运用form表单网络广告策划书模板范文
  • 简单旅游网站模板下载网络推广和网络营销的区别
  • 服务平台入口win10系统优化软件哪个好
  • 视频一页网站怎么做免费发布广告信息平台
  • 北京做电商网站设计营销网页设计公司
  • 模板网站是什么意思游戏推广怎么快速拉人
  • 番禺网站建设外包西安seo按天收费
  • 教育网站建设市场分析计划书杭州百度
  • 网站站群建设重庆百度小额贷款有限公司
  • 小公司让我用织梦做网站网上推广赚钱方法
  • 义乌门户网站建设营销策划案
  • 描述一下网站建设的基本流程百度极速版下载安装
  • 网站建设收费详情微信公众号推广网站
  • 网站建设邀标方案百度广告费
  • 网站改版的几个建议网站推广公司黄页
  • 推荐盐城网站建设seo排名赚挂机
  • 做网站营销公司有哪些网推项目平台
  • wordpress 图片网站舆情监测系统排名
  • 商城网站设计教程网站排名优化软件哪家好
  • 寺庙网站开发文案网站优化排名