当前位置: 首页 > news >正文

Debezium系列之:记录一次源头数据库刷数据,造成数据丢失的原因

Debezium系列之:记录一次源头数据库刷数据,造成数据丢失的原因

  • 一、背景
  • 二、查看topic日志信息
  • 三、结论
  • 四、解决方法

一、背景

  • 源头数据库在很短的时间内刷了大量的数据,部分数据在hdfs丢失了
    在这里插入图片描述

  • 理论上debezium数据采集不会丢失,就需要排查数据链路某个节点是否有数据丢失。

  • 数据链路是:debezium——kafka——flume——hdfs

  • 根据经验定位数据在kafka侧丢失,下一面进一步确认是否数据在kafka侧丢失

二、查看topic日志信息

Kafka日志信息如下:

[2025-02-20 23:58:21,009] INFO [Log partition

相关文章:

  • RoboBERT:减少大规模数据与训练成本,端到端多模态机器人操作模型(西湖大学最新)
  • MySQL-慢SQL解析及调试分析思路
  • go channel 的用法和核心原理、使用场景
  • JUC并发—10.锁优化与锁故障
  • Spring Boot (maven)分页4.0.2版本 专业版- 模板化最终版(测试)
  • java多线程及线程池
  • Web自动化中Selenium下Chrome与Edge的Webdriver常用Options参数
  • 鸿蒙app 开发中 对于数组方法 filter 的理解
  • 洛谷B3629
  • C#初级教程(7)——初级期末检测
  • 代码随想录第十六天|二叉树part05--654.最大二叉树、617.合并二叉树、700.二叉搜索树中的搜索、98.验证二叉搜索树
  • 前端面试-网络协议篇
  • 创建监听器报错“一个或多个listeners启动失败”
  • Java之泛型
  • Windows安装MySQL指南
  • SAP on Microsoft Azure Architecture and Administration (Ravi Kashyap)
  • LangChain系列:精通LangChain的合并文档链
  • 【论文阅读】SAM-CP:将SAM与组合提示结合起来的多功能分割
  • LeetCode 236.二叉树的最近公共祖先
  • 抗辐照加固CAN FD芯片的商业航天与车规级应用解析
  • 《蛮好的人生》:为啥人人都爱这个不完美的“大女主”
  • 在笔墨金石间,看胡问遂与梅舒适的艺术对话
  • 【社论】个人破产探索,要守住“诚实而不幸”的底线
  • 印称印巴军事行动总指挥同意将局势降级
  • 中国潜水救捞行业协会发布《呵护潜水员职业健康安全宣言》
  • 美国政府信用卡被设1美元限额,10美元采购花一两小时填表