当前位置: 首页 > news >正文

Kafka

Kafka概念

        https://kafka.apache.org/

        Kafka是一种高吞吐量的分布式发布订阅消息系统,使用 Scala 语言编写。

        producer通过网络发送消息到Kafka集群,然后consumer来进行消费,如下图: 

        服务端(brokers)和客户端(producer、consumer)之间通信通过TCP协议来完成。

broker

        Kafka 服务器,负责消息存储和转发。

topic

        消息类别,Kafka 按照 topic 来分类消息,发布到Kafka集群的每条消息都需要指定一个topic。

partition

        topic 的分区,物理上的概念,一个 topic 可以包含多个 partition,topic 消息保存在各个 partition 上 ,每个partition内部消息是有序的。

        在Kafka中,一个分区的数据只能被同一个消费组中的一个消费者消费‌。Kafka的设计保证了消息的顺序性(FIFO),即一个分区内的消息只能被同一个消费组中的一个消费者消费,以确保消息的顺序不被打乱。‌

offset

         消息在日志中的位置,可以理解是消息在 partition 上的偏移量,也是代表该消息的唯一序号。

Producer

        消息生产者,向Broker发送消息的客户端。

Consumer

        消息消费者,从Broker读取消息的客户端。

Consumer Group

       消费者分组,每个 Consumer 必须属于一个特定的Consumer Group,一条消息可以被多个不同的Consumer Group消费,但是一个Consumer Group中只能有一个Consumer能够消费该消息。

Zookeeper

        保存着集群 broker、topic、partition 等 meta 数据;另外,还负责 broker 故障发现,partition leader 选举,负载均衡等功能。

Kafka消费者组和分区的对应关系

‌同一个消费组‌:

      在一个消费组内,每个分区只能被该组中的一个消费者消费。例如,如果一个主题有3个分区,那么在一个消费组内最多可以有3个消费者,每个消费者负责消费一个分区。

‌不同消费组‌:

       不同的消费组可以消费同一个分区的消息。例如,一个分区可以被消费组A的消费者消费,同时也可以被消费组B的消费者消费,但不会重复消费。

kafka为什么那么快?

磁盘顺序读写

         顺序IO

零拷贝机制

        内存映射文件

        零拷贝(避免了在内核空间用户空间之间的拷贝,从而提高了I/O速度)

分区架构和批量操作

          Kafka的集群架构采用了多分区技术,并行度高。生产者发送的消息先发送到一个队列,然后有sender线程批量发送给Kafka集群,这种设计提高了生产者的吞吐量。

PageCache利用(页缓存技术)

        Kafka利用了操作系统本身的pagecache,通过操作系统的pagecache,Kafka的读写操作基本上是基于内存的,读写速度得到了极大的提升。

 

http://www.dtcms.com/a/23629.html

相关文章:

  • 训练数据为什么需要Shuffle
  • 如何使用qt开发一个xml发票浏览器,实现按发票样式显示
  • Java 设计模式之命令模式
  • 分布式 IO 模块:食品罐装产线自动化与高效运行的推手
  • 个人搭建CDN加速服务 特网科技
  • 解决vue-awesome-swiper 4.x + swiper 5.x 分页pagination配置不生效问题
  • Dify本地安装
  • 开源在线考试系统开源在线考试系统:支持数学公式的前后端分离解决方案
  • 动态内存管理
  • 栈与队列(C语言版)
  • 数据分析简介及其常用指标与方法
  • 毕业设计—基于Spring Boot的社区居民健康管理平台的设计与实现
  • java接口
  • DeepSeek教unity------Dotween
  • 部署postgresql_exporter监控pgsql
  • mysql增加字段操作以及关键字报错
  • MATLAB中regexpi函数用法
  • 想要追踪一个在传送带上运动的东西,该怎么选择工业相机呢,需要考虑哪些因素
  • 国产Linux OS:网络性能调优关键内核参数
  • 【医学影像AI】50个眼科影像数据集(1)分类任务
  • 软件测试技术之跨平台的移动端UI自动化测试(上)
  • VSCode 中使用 Snippets 设置常用代码块
  • 数据结构:顺序表(Sequence List)及其实现
  • Natural Language Processing NLP
  • Ubuntu轻松部署ToolJet低代码开发平台结合内网穿透远程访问
  • Blackbox.AI:高效智能的生产力工具新选择
  • 实用且美观,一款简单且模块化的UI组件库!
  • 【Linux】【网络】Libevent 内部实现简略版
  • CentOS 7.8 安装MongoDB 7 副本集(Replica Set)
  • Datablau产品全面接入DeepSeek