当前位置: 首页 > news >正文

Kafka04-知识速记

Kafka04-知识速记

按“概念→通信→分区→可靠性→副本→性能”逻辑顺序排列,答案均≤2 行。原博客地址:https://mp.weixin.qq.com/s/lfqZinenUoWPp62HGfv6tw

文章目录

  • Kafka04-知识速记
  • 1. 基础概念
  • 2. 通信流程(启动→生产→消费)
  • 3. 分区策略
  • 4. 消费者组与 Rebalance
    • 三种分配策略
  • 5. 可靠性三板斧
  • 6. 副本同步(HW/LEO 机制)
  • 7. 为什么去 ZooKeeper(≥v2.8 KRaft 模式)
  • 8. Kafka “快”的三板斧


1. 基础概念

名词一句话解释
Record一条消息。
Topic消息的分类目录。
PartitionTopic 的水平分片,提升并发与伸缩。
Offset分区级别自增序号,标识消息位置。
BrokerKafka 进程/服务器实例。
Leader/Follower每分区一个对外服务的 Leader,其余 Follower 仅冗余。
ISR与 Leader 差距 ≤ replica.lag.time.max.ms 的副本集合。
Producer发消息端。
Consumer读消息端。
Consumer Group组内共享订阅,组间广播;天然支持点对点 vs 发布订阅。
Coordinator为消费者组做分区分配与 Rebalance。
Controller集群“班长”,负责 Leader 选举与元数据变更。

2. 通信流程(启动→生产→消费)

  1. Broker 启动 → 向 ZK 注册临时节点。
  2. 客户端(生产/消费)通过 bootstrap.servers 任连一台 → 取完整元数据 → 再与对应 Broker 建连。
  3. 生产者按分区策略把批次消息发给 Leader;消费者连 Leader 拉取。

3. 分区策略

策略行为
指定 keyhash(key) % 分区数 → 相同 key 落同分区(分区有序)。
无 key轮询或随机。
自定义实现 Partitioner 接口。

> 目的:数据分散 → 并行写/读 → 横向扩展。


4. 消费者组与 Rebalance

  • 理想数:消费者数 = 总分区数。
  • 触发:成员增减、分区数变、订阅正则匹配到新 Topic。
  • 过程:JoinGroup → 选群主 → 群主用策略算分配 → SyncGroup 下发。
  • 影响:Rebalance 期间全组停止消费(类似 STW)。

三种分配策略

名称特点
Range(默认)按主题序分配,多主题时易倾斜。
RoundRobin全局轮询,均衡但无状态。
Sticky在均衡前提下尽量保留上次分配,减少连接抖动。

5. 可靠性三板斧

环节配置要点
生产者acks=all + 大 retries + 异步回调。
Brokerreplication.factor≥3 & min.insync.replicas≥2 & unclean.leader.election.enable=false
消费者enable.auto.commit=false 手动提交;auto.offset.reset=earliest 防丢。

6. 副本同步(HW/LEO 机制)

  • HW:已提交边界,消费者可见。
  • LEO:下条待写位移。
  • 同步节奏:Follower 拉取 → 更新自身 LEO → Leader 取最小 LEO 更新 HW → 下次响应带回 HW → Follower 更新 HW。

7. 为什么去 ZooKeeper(≥v2.8 KRaft 模式)

  • 少运维一套 ZK 集群,降复杂度。
  • ZK 不适合高频写(如位移),易成瓶颈。
  • 自管元数据可水平扩展,支持百万分区级。

8. Kafka “快”的三板斧

  1. 顺序追加写磁盘 → 磁盘顺序 IO ≈ 网络 IO。
  2. PageCache + 零拷贝(mmap 写,sendfile 读)→ 省一次内存拷贝。
  3. 批量压缩(生产端攒批、压缩,Broker 原样存,消费端解压)→ 降网络与磁盘量。
http://www.dtcms.com/a/418813.html

相关文章:

  • 【Linux】高级I/O
  • 开源的容器化平台:Docker高级应用与实战案例
  • 3.7 广域网 (答案见原书 P116)
  • 临淄网站制作首选公司seo排名需要多少钱
  • k8s-部署单master节点
  • Python 2025:量子计算编程的新前沿
  • 二级学院网站建设自评报告互联网营销公司有哪些
  • 做网站滨州现在写博客还是做网站
  • 基于 Service Worker 的图书馆资源缓存技术研究
  • php网站后台验证码不显示哈尔滨教育云平台网站建设
  • 银行门户网站是什么意思网页设计代码中字体的颜色如何改
  • 【代码的暴力美学】-- C语言基础编程题_1
  • Java 架构师系列:JVM 与 AI 负载的优化策略
  • 数据分析-Excel-常用函数
  • Python 文件操作
  • Java 大视界 -- Java 大数据机器学习模型在电商产品销量预测与库存优化管理中的应用
  • 陕西开龄建设网站浙江省建设厅网站如何查安全员
  • 使用 Jenkins 的流水线项目实施 CI/CD
  • 网站建设平台安全问题有哪些方面做网站自动赚钱吗
  • (八)掌握继承的艺术:重构之路,化繁为简
  • 文成做网站国外网站如何做推广
  • 云栖2025 | 阿里云AI搜索年度发布:开启Agent时代,重构搜索新范式
  • 让每次语音唤醒都可靠,公牛沐光重构可观测体系
  • 黄峥的成功之道:重构电商版图的创新密码
  • 数字大健康崛起:艾灸机器人重构就业生态,传统与科技如何共生?
  • 得物笔试题
  • Xenium空间转录组实战 | Xenium Explorer 多样本拼片拆分 ROI 区域圈选
  • 对称加密和非对称加密算法的区别
  • 下载了模板如何做网站太原seo推广
  • 微算法科技(NASDAQ MLGO)探索全同态加密与安全多方计算融合,开启区块链隐私执行新时代