当前位置: 首页 > news >正文

Kafka系列之:记录一次源头数据库刷数据,造成数据丢失的原因

Kafka系列之:记录一次源头数据库刷数据,造成数据丢失的原因

  • 一、背景
  • 二、查看topic日志信息
  • 三、结论
  • 四、解决方法

一、背景

  • 源头数据库在很短的时间内刷了大量的数据,部分数据在hdfs丢失了
    在这里插入图片描述

  • 理论上debezium数据采集不会丢失,就需要排查数据链路某个节点是否有数据丢失。

  • 数据链路是:debezium——kafka——flume——hdfs

  • 根据经验定位数据在kafka侧丢失,下一面进一步确认是否数据在kafka侧丢失

二、查看topic日志信息

Kafka日志信息如下:

[2025-02-20 23:58:21,009] INFO [Log partition

相关文章:

  • Chrome 推出全新的 DOM API,彻底革新 DOM 操作!
  • 【MySQL】索引和视图
  • Starlink卫星动力学系统仿真建模第七讲-卫星姿轨控系统(Attitude and Orbit Control System, AOCS)设计规范
  • 智信BI:解决Power BI全面兼容问题的新选择
  • List模拟实现
  • CellChat前沿:spaCI:通过自适应图模型破译空间蜂窝通信
  • vs构建网络安全系统 网络安全和网络搭建
  • 在群晖上使用Docker安装思源笔记
  • 【Node.js】包的结构及发布
  • 深度学习学习笔记(34周)
  • 如何评估光伏项目是否可行?需要投资多少?
  • 分类解析决策模型
  • 【从0做项目】Java音缘心动(5)———上传、播放音乐
  • springboot初始化代码
  • Power Query M函数
  • <02.22>Leetcode100
  • JVM内存模型
  • 七星棋牌顶级运营产品全开源修复版源码教程:6端支持,200+子游戏玩法,完整搭建指南(含代码解析)
  • 曾经的 “明日之星”——AI Pin 的前世今生
  • 蓝思科技赋能灵伴科技:AI眼镜产能与供应链双升级
  • 2025年五一档电影票房破4亿,《水饺皇后》领跑
  • 华尔兹转岗与鲁比奥集权:特朗普政府人事震荡背后的深层危机
  • 美伊谈判因“后勤原因”推迟,伊朗:视美国做法再定谈判日期
  • 专家分析丨乌美签署矿产协议,展现美外交困境下的无奈
  • 两部门预拨4000万元支持山西、广西、陕西做好抗旱救灾工作
  • “上博号”彩绘大飞机今日启航:万米高空传播中国古代文化