当前位置: 首页 > news >正文

Kafka消息不丢失处理

        kafka作为消息中间件,吞吐量大(至于为啥吞吐量大,本文不做介绍),所以大家用的多。涉及到异构数据库更换,以及数据预处理后的迁移,基本想到的都是通过kafka。

概览图

        我先画个图

生产者到kafka

推荐用kafkla0.11后的版本,有幂等性,开启后,即使生产者因为网络抖动重发到Kafka中,kafka也会自动去重,保证消费者不会重复消费。

enable.idempotence = true

我们已经保证了生产者不会丢数据,也不会有重复数据。

kafka到消费者

一般我们用第二种,可以保证数据不丢失。

ps:如果消费者挂了(集群的第一个节点挂了),新的节点会重新拉去这个offset,会导致重复消费(重复消费很好解决,比如有多个指令插入数据库,第一个指令成功了,后面的失败了,我们可以加一个事务,保证一致性。这种就解决了数据库的重复,或者我们插入前先根据id查询,保证一致性。存在我就不插入。或者后面去重,在消费者端处理方法很多)

如果kakfa挂了

kafka是集群,如果一个broker挂了,其他的【有备份】,那没事,除非broker都挂了(集群都挂概率很小,尤其是多az--区域数据中心),否则数据不会丢的。只要已经commit(提交到kafka)了。

备份怎么做?这就涉及到ack确认机制了,给他为-1,就会提交到每个broker,只要有一个broker正常,也没事。

参考:

https://zhuanlan.zhihu.com/p/459610418

豆包(帮忙答疑不懂的)

http://www.dtcms.com/a/178751.html

相关文章:

  • leetcode 3342. 到达最后一个房间的最少时间 II 中等
  • IC ATE集成电路测试学习——PLL测试(一)
  • 2025年前端在线协同编辑技术研究
  • 使用Compose编排工具搭建Ghost博客系统
  • 《易语言学习大全》
  • maven如何搭建自己的私服(LINUX版)?
  • ubuntu 22.04 换源
  • Java内存分配
  • 天选5Pro(锐龙版)设备声音、显卡消失等问题完整解决记录
  • C++使用PoDoFo库处理PDF文件
  • WPF实时调试的一种实现方法
  • 推测式思维树:让大模型快速完成复杂推理
  • 探索网络设备安全:Shodan 的原理与合法应用
  • 接口自动化测试框架详解(pytest+allure+aiohttp+ 用例自动生成)
  • C++GO语言微服务基础技术②
  • vite 代理 websocket
  • Golang中集合相关的库
  • 系统思考助力富维东阳
  • pycharm无法导入相对路径下其它文件
  • 书法机构用的教务管理系统
  • 从装饰器出发,优雅处理 UI 自动化中的异常
  • Ubuntu每次开机IP都是127.0.0.1
  • JS 问号(?)运算符避免中间报错
  • 【Python从入门到精通】--‘@‘符号的作用
  • ComfyUI 学习笔记,案例 6 :FLUX 模型文生图
  • 芯片测试之Open-Short Test全解析:从原理到实战
  • vite 初始化react项目
  • 实时云渲染——比像素流送节省80%精力的UE程序推流技术
  • helm的原理及作用
  • AquaCrop 模型新视角:多技术助力农业精准水管理