当前位置: 首页 > wzjs >正文

网站建设公司河南关键词搜索查询

网站建设公司河南,关键词搜索查询,企业网站建立,军人可以做网站吗1. 引言 Apache Kafka 是一个高性能、分布式的消息系统,其核心设计依赖于 Broker、分片(Partition) 和 副本(Replica) 的协同工作。Broker 作为 Kafka 集群的基本服务单元,负责管理分片和副本的存储、同步…

1. 引言

Apache Kafka 是一个高性能、分布式的消息系统,其核心设计依赖于 Broker分片(Partition)副本(Replica) 的协同工作。Broker 作为 Kafka 集群的基本服务单元,负责管理分片和副本的存储、同步、故障恢复等关键任务。本文将深入探讨 Kafka Broker 如何管理分片和副本,以及其背后的机制。


2. Kafka Broker 的基本职责

Kafka Broker 是 Kafka 集群中的服务器节点,每个 Broker 负责:

  • 存储分片数据(Partition)
  • 处理生产者和消费者的读写请求
  • 维护副本同步
  • 参与 Leader 选举
  • 监控集群状态

Broker 之间通过 ZooKeeper(旧版本)或 KRaft(新版本) 进行协调,确保数据一致性和高可用性。


3. 分片(Partition)与副本(Replica)

3.1 分片(Partition)

  • Kafka 的 Topic 被划分为多个 分片(Partition),每个分片是一个有序、不可变的消息队列。
  • 分片允许 Kafka 水平扩展,提高并行处理能力。

3.2 副本(Replica)

  • 每个分片可以有 多个副本(由 replication.factor 配置,通常为 3)。
  • 副本分为:
    • Leader 副本:处理所有读写请求。
    • Follower 副本:从 Leader 异步拉取数据,保持同步。

副本分布在不同的 Broker 上,以提高容错能力。


4. Broker 如何管理分片和副本

4.1 副本分配策略

当创建一个 Topic 时,Kafka 会自动分配分片副本到不同的 Broker,遵循以下原则:

  1. 同一分片的副本不能放在同一个 Broker(避免单点故障)。
  2. 尽量均衡 Leader 副本分布(避免某些 Broker 负载过高)。
  3. 支持机架感知(Rack Awareness)(副本分布在不同的机架,提高容灾能力)。

4.2 Leader/Follower 机制

  • Leader 副本

    • 处理所有生产者和消费者的读写请求。
    • 负责推进 高水位(High Watermark, HW),表示已提交(committed)的消息偏移量。
  • Follower 副本

    • 定期从 Leader 拉取数据(fetch 请求)。
    • 如果 Follower 落后太多,会被移出 ISR(In-Sync Replicas) 列表。

4.3 ISR(In-Sync Replicas)

  • ISR 是当前与 Leader 保持同步的副本集合。
  • 只有 ISR 中的副本才有资格被选为新的 Leader。
  • 如果 Follower 长时间未同步(replica.lag.time.max.ms 超时),会被移出 ISR。

4.4 高水位(HW)与 LEO(Log End Offset)

  • LEO(Log End Offset):表示副本最新写入的消息偏移量。

  • HW(High Watermark):表示所有 ISR 副本都已确认的消息偏移量(消费者只能读到 HW 之前的消息)。

    例如:

    Leader LEO = 10
    Follower1 LEO = 8
    Follower2 LEO = 9
    => HW = 8(所有副本都确认到 8)
    

4.5 请求处理流程

  1. 生产者发送消息

    • 请求发送到 Leader 副本。
    • Leader 写入本地日志,并等待 ISR 副本确认。
    • 当所有 ISR 副本确认后,HW 推进,返回 ack 给生产者。
  2. 消费者读取消息

    • 消费者只能读取 HW 之前的消息(确保数据一致性)。
    • 如果请求发送到 Follower,会被重定向到 Leader。

4.6 Leader 选举

  • 当 Leader 副本宕机时,Controller Broker 会从 ISR 中选举新的 Leader。
  • 如果没有可用的 ISR 副本,Kafka 可能会:
    • 等待副本恢复(unclean.leader.election.enable=false,默认)。
    • 选择非 ISR 副本(unclean.leader.election.enable=true,可能丢失数据)。

4.7 副本同步机制

Follower 副本通过 拉取(fetch) 请求从 Leader 同步数据:

  • 周期性拉取fetch.min.bytesfetch.wait.max.ms 控制频率)。
  • HW 更新:只有当所有 ISR 副本都确认消息后,HW 才会推进。

4.8 故障恢复

  • Broker 宕机

    • Controller 检测到 Broker 下线,触发 Leader 重新选举。
    • 恢复后,副本会从 Leader 重新同步缺失的数据。
  • 副本滞后(Lagging Replica)

    • 如果 Follower 长时间未同步,会被移出 ISR。
    • 恢复后,会从 Leader 重新同步数据(可能触发 Log Truncation,丢弃不一致的数据)。

5. 磁盘存储管理

Broker 对分片的存储采用 日志分段(Log Segments) 策略:

  • 每个分片的数据被拆分为多个 segment 文件(默认 1GB)。
  • 每个 segment 包含:
    • .log 文件(存储消息)
    • .index 文件(偏移量索引)
    • .timeindex 文件(时间戳索引)
  • 日志清理策略
    • delete(默认):基于时间或大小删除旧数据。
    • compact:仅保留每个 key 的最新值(适用于 KV 存储场景)。

6. Controller Broker 的特殊角色

Kafka 集群中有一个 Broker 会被选举为 Controller,负责:

  • 监控 Broker 状态(通过 ZooKeeper/KRaft)。
  • 管理 Leader 选举(当 Leader 宕机时,从 ISR 中选择新 Leader)。
  • 处理分片重新分配(如 kafka-reassign-partitions 命令)。
  • 维护集群元数据(如 Topic、Broker、分片信息)。

7. 总结

Kafka Broker 通过 分片、副本、Leader/Follower 机制、ISR、HW/LEO 等设计,实现了:
高吞吐量(分片并行处理)
高可用性(副本容错)
数据一致性(HW 机制)
自动故障恢复(Leader 选举)

理解 Broker 如何管理分片和副本,有助于优化 Kafka 集群配置,提高稳定性和性能。

http://www.dtcms.com/wzjs/168214.html

相关文章:

  • 设计建设网站公司网站网站模板哪家好
  • 网站的静态页面谁做上海seo博客
  • 导入表格做地图中热力网站珠海seo关键词排名
  • 网页升级访问更新中狼黄山seo
  • 网站做微信小程序win7优化设置
  • 网页加速器破解版百度关键词优化教程
  • 广州做包包的网站好中国免费域名注册平台
  • 小程序在线开发狼雨seo网站
  • 百度seo2022新算法更新搜索引擎网站排名优化方案
  • 设计app需要的技术厦门关键词优化企业
  • 三站一体网站公司上海aso优化公司
  • 潍坊360做网站怎么样关键词分析工具网站
  • wordpress切换中文百度app优化
  • 街道口做网站公司外贸网站建设公司
  • 网站 版本 白名单 wap 解析网络营销课程总结
  • 建立网站的好处链接买卖是什么意思
  • 鹿邑网站建设专业搜索引擎seo技术公司
  • c 网站开发简单实例深圳搜索引擎优化推广便宜
  • 做男装海报的素材网站网络做推广公司
  • 西安网站优化百度超级链数字藏品
  • 手机端网站开发流程图全网营销推广方案外包
  • 福田做网站哪家专业网络营销推广实战宝典
  • dede网站头部不显示调用的名称seo网站关键词优化方式
  • 中企动力做的网站容易SEO吗网站竞价推广
  • 网站怎么做图片动态图片不显示如何制作小程序
  • 网站建设排名优化公司百度手机助手免费下载
  • 谷歌外贸建站河北百度推广
  • 18元套餐百度推广优化排名
  • 有趣的网站小游戏经典广告推广词
  • 南昌做网站哪家公司好百度推广客户端官方下载