当前位置: 首页 > news >正文

【C/C++】从零开始掌握Kafka

文章目录

  • 从零开始掌握Kafka
    • 一、Kafka 基础知识理解(理论)
      • 1. 核心组件与架构
      • 2. 重点概念解析
    • 二、Kafka 面试重点知识梳理
    • 三、C++ 使用 Kafka 的实践(librdkafka)
      • 1. librdkafka 简介
      • 2. 安装 librdkafka
    • 四、实战:高吞吐生产者与消费者
      • 1. 生产者示例(Producer.cpp)
      • 2. 消费者示例(Consumer.cpp)
    • 五、Kafka 开发相关 C++ 能力要求
      • 必备 C++ 能力
      • 推荐工具链
    • 六、项目实践建议
      • 1. 项目目标
      • 2. 模块设计建议
    • 七、推荐资料与开源项目

从零开始掌握Kafka

一、Kafka 基础知识理解(理论)

1. 核心组件与架构

组件作用
BrokerKafka 节点,负责存储消息
Topic消息主题,逻辑上的分类
Partition一个 Topic 的分片,支持并发与扩展性
Producer负责发送消息
Consumer负责消费消息
Consumer Group多消费者协作消费
Zookeeper / KRaft负责元数据与协调(未来版本转向 KRaft 模式)

2. 重点概念解析

  • Partition:分片,支持水平扩展(每个 partition 是一个有序日志)。

  • 副本机制(Replication):每个 Partition 有一个 leader + N 个 follower,保证高可用。

  • 消费者组(Consumer Group):Kafka 实现广播和负载均衡消费的机制。

  • offset 管理

    • 自动提交(enable.auto.commit)
    • 手动提交(commitSync / commitAsync)
    • Kafka 默认 offset 存在 __consumer_offsets topic 中。

二、Kafka 面试重点知识梳理

面试点说明
消息顺序性同一个 partition 内有顺序,跨 partition 无法保证
幂等性生产使用 enable.idempotence=true,避免 producer 重试造成重复发送
分布式一致性ISR 机制,消息写入需同步到 follower;ACK=all 实现强一致
消费位点提交手动提交 offset 是保证消费语义精确一次的关键
Rebalance 原理消费者上下线会触发 Rebalance,导致 partition 分配变化

三、C++ 使用 Kafka 的实践(librdkafka)

1. librdkafka 简介

  • 官方提供的高性能 C/C++ Kafka 客户端库。

  • GitHub 地址:https://github.com/edenhill/librdkafka

  • 支持:

    • 高吞吐的生产与消费
    • offset 提交
    • topic/partition 管理
    • 幂等发送、压缩、批处理

2. 安装 librdkafka

# Ubuntu
sudo apt-get install librdkafka-dev# Or from source
git clone https://github.com/edenhill/librdkafka.git
cd librdkafka
./configure
make
sudo make install

四、实战:高吞吐生产者与消费者

1. 生产者示例(Producer.cpp)

#include <librdkafka/rdkafkacpp.h>class ExampleDeliveryReportCb : public RdKafka::DeliveryReportCb {
public:void dr_cb(RdKafka::Message &message) override {if (message.err()) {std::cerr << "Delivery failed: " << message.errstr() << std::endl;} else {std::cout << "Delivered message to " << message.topic_name()<< " [" << message.partition() << "] at offset "<< message.offset() << std::endl;}}
};int main() {std::string errstr;std::string topic = "test_topic";RdKafka::Conf *conf = RdKafka::Conf::create(RdKafka::Conf::CONF_GLOBAL);conf->set("bootstrap.servers", "localhost:9092", errstr);ExampleDeliveryReportCb dr_cb;conf->set("dr_cb", &dr_cb, errstr);RdKafka::Producer *producer = RdKafka::Producer::create(conf, errstr);delete conf;for (int i = 0; i < 10000; ++i) {std::string message = "Message " + std::to_string(i);producer->produce(topic, RdKafka::Topic::PARTITION_UA,RdKafka::Producer::RK_MSG_COPY,const_cast<char *>(message.c_str()), message.size(),nullptr, 0, 0, nullptr);producer->poll(0); // 异步发送需要poll触发回调}producer->flush(10000); // 等待所有消息发送完成delete producer;
}

2. 消费者示例(Consumer.cpp)

#include <librdkafka/rdkafkacpp.h>int main() {std::string errstr;RdKafka::Conf *conf = RdKafka::Conf::create(RdKafka::Conf::CONF_GLOBAL);conf->set("bootstrap.servers", "localhost:9092", errstr);conf->set("group.id", "my_group", errstr);conf->set("enable.auto.commit", "false", errstr); // 手动提交RdKafka::KafkaConsumer *consumer = RdKafka::KafkaConsumer::create(conf, errstr);delete conf;std::vector<std::string> topics = {"test_topic"};consumer->subscribe(topics);while (true) {RdKafka::Message *msg = consumer->consume(1000);switch (msg->err()) {case RdKafka::ERR_NO_ERROR:std::cout << "Read msg at offset " << msg->offset()<< ": " << static_cast<const char *>(msg->payload()) << std::endl;consumer->commitAsync(msg);  // 或 commitSync(msg)break;case RdKafka::ERR__TIMED_OUT:break;default:std::cerr << "Error: " << msg->errstr() << std::endl;}delete msg;}consumer->close();delete consumer;
}

五、Kafka 开发相关 C++ 能力要求

必备 C++ 能力

  • 熟练使用 RAII、智能指针、异常处理
  • 理解线程安全、异步模型(poll, callback)
  • 能够结合 JSON/XML 配置 Kafka 客户端
  • 编写模块化、高性能的消息收发组件

推荐工具链

  • 构建系统:CMake
  • 日志:spdlog 或 glog
  • 单元测试:gtest
  • JSON:nlohmann/json

六、项目实践建议

1. 项目目标

构建一个 C++ Kafka 模块,支持:

  • 高吞吐量生产(批量发送,压缩)
  • 幂等性保障
  • 多线程消费 + 位点提交策略
  • 简单的失败重试机制
  • 支持 JSON 格式的序列化消息

2. 模块设计建议

模块功能
KafkaProducer封装 Producer 初始化/发送逻辑
KafkaConsumer封装 Consumer + offset 管理
ConfigManager读取配置
Message消息封装与解析(支持 JSON)

七、推荐资料与开源项目

  • 📚 Kafka 权威指南(原书第2版)

  • 📘 librdkafka 文档

  • 📖 Apache Kafka 官方文档

  • 💻 开源项目参考:

    • confluent-kafka-cpp
    • cppkafka(封装更现代 C++)

相关文章:

  • Linux 下VS Code 的使用
  • 从AD9361 到 ADSY1100 ,中间的迭代产品历史
  • 动态规划-蓝桥杯-健身
  • 大数据学习(118)-SQL面试问题总结
  • RAG系统构建之嵌入模型性能优化完整指南
  • QML学习07Property
  • vue+js 创造动态的光晕圈
  • 8:OpenCV—仿射变换和坐标映射
  • Linux的进程控制
  • 从工程实践角度分析H.264与H.265的技术差异
  • 如何将ChatGPT添加到WordPress(新手指南)
  • 大数据与数据分析【数据分析全栈攻略:爬虫+处理+可视化+报告】
  • 华为OD机试真题—— 矩阵中非1的数量 (2025B卷:200分)Java/python/JavaScript/C/C++/GO最佳实现
  • 顺丰社招入职SHL测评真题讲解| 3天备考、综合能力及性格问卷答题讲解
  • 打羽毛球tips
  • Bochs下去运行linux-0.11
  • 定时任务调度平台XXL-JOB
  • JavaSE核心知识点03高级特性03-05(注解)
  • C# Windows Forms应用程序-002
  • 2025.5.25总结
  • 一个服务器可以做两个网站/沧州网站建设推广
  • 网站语言 java/宁德市教育局官网
  • 滨江区高端网站建设/网络营销的企业有哪些
  • 网站垃圾代码检查工具/经典软文
  • 南宁模板建站哪家好/英语seo
  • 手机网站建设 豆丁/广告公司网站制作