当前位置: 首页 > news >正文

python---kafka常规使用

安装依赖

在开始之前,需要安装 kafka-python 库。可以通过以下命令安装:

pip install kafka-python

创建生产者

生产者负责将消息发送到 Kafka 主题。以下是一个简单的生产者示例:

from kafka import KafkaProducer
import json
import time# 配置 Kafka 服务器地址和序列化方式
producer = KafkaProducer(bootstrap_servers='****:9092',  # Kafka Broker 地址value_serializer=lambda v: json.dumps(v).encode('utf-8'),  # JSON 序列化acks='all',  # 确保消息被所有副本确认retries=3  # 失败重试次数
)# 发送单条消息
producer.send('testTopic',  # 目标主题value={'message': 'Hello Kafka', 'timestamp': int(time.time())}
)# 批量发送消息(示例发送10条)
messages = [{'id': i, 'data': f'Message {i}'} for i in range(10)]
for msg in messages:producer.send('testTopic', value=msg)time.sleep(0.1)  # 控制发送频率防止阻塞# 确保所有消息发送完成并关闭连接
producer.flush(timeout=10)
producer.close()

创建消费者

消费者负责从 Kafka 主题中读取消息。以下是一个简单的消费者示例:

from kafka import KafkaConsumer
import json# 配置消费者组和反序列化方式
consumer = KafkaConsumer('testTopic',  # 订阅主题bootstrap_servers='****:9092',group_id='my_consumer_group',  # 消费者组(同一组共享消息)auto_offset_reset='earliest',  # 从最早未消费的消息开始读取value_deserializer=lambda x: json.loads(x.decode('utf-8'))  # JSON 反序列化
)# 持续消费消息
try:for message in consumer:print(f"""收到消息:主题: {message.topic}分区: {message.partition}偏移量: {message.offset}内容: {message.value}""")
except KeyboardInterrupt:print("用户中断操作")
finally:consumer.close()  # 关闭消费者连接

Kafka 服务器

运行 Kafka 服务器,快速启动 Kafka 和 Zookeeper:

bin/kafka-server-start.sh -daemon config/server.properties

创建指定topic的kafka的分区

./kafka-topics.sh --alter --topic testTopic --partitions 2 --bootstrap-server localhost:9092

 查询指定topic的kafka分区

./kafka-topics.sh --bootstrap-server localhost:9092 --describe --topic testTopic

通过以上步骤,可以快速构建一个基于 Kafka 的消息队列系统,并在 Python 中实现消息的生产和消费。

注意:

1、kafka广播模式:

不同的分组(group_id参数不同)收到的数据是一致的,类似于广播模式

2、kafka路由模式:

同一分组(group_id参数相同)对同一批数据进行处理,如果kafka服务器的分区数量大于该分组内的消费者数量,则每个消费者可以分到一些分区,每个消费者去处理自己对应分区里面的数据,类似于路由模式下的多消费者情形,如果消费者数量大于分区数,则多出来的消费者是被闲置的

相关文章:

  • nginx的学习笔记
  • shopping mall(document)
  • PPT插入图像自带透明
  • 革新锅炉厂智能控制——Ethernet IP转CANopen协议网关的工业互联新方案
  • gd32 编译环境
  • Java 自动下载 Chromium
  • 嵌入式学习笔记 - 关于单片机的位数
  • Spring生态全景解析:Spring、Spring MVC、SpringBoot与Spring Cloud的关系
  • ClickHouse多表join的性能优化:原理与源码详解
  • element-ui分页的使用及修改样式
  • 38-算法打卡-栈与队列-前 K 个高频元素-leetcode(347)-第三十八天
  • uni-app使用web-view组件APP实现返回上一页
  • 数组和切片的区别
  • 常见问题-SQLServer中创建新数据库使用哪个中文编码?
  • 无人机电池储存与操作指南
  • LlamaIndex 第六篇 SimpleDirectoryReader
  • PostgreSQL 的 pg_advisory_lock 函数
  • Redhat 系统详解
  • Windows系统下【Celery任务队列】python使用celery 详解(二)
  • Windows 下 dll转换成lib
  • 洗冤录|县令遇豪强:黄榦处理的一起地产纠纷案
  • 七大交响乐团在沪“神仙斗法”,时代交响奏出何等时代新声
  • 成都公积金新政征求意见:购买保障性住房最高贷款额度上浮50%
  • “救护车”转运病人半路加价,从宝鸡到西安往返都要多收钱
  • 美联储主席:美联储工作方式不会受特朗普影响,从未寻求与总统会面
  • 公元1057年:千年龙虎榜到底有多厉害?