当前位置: 首页 > news >正文

ceph scrub 错误记录

目的

  1. 记录 ceph scrub 错误问题
  2. 解决 ceph scrub 故障

故障信息

  cluster:
    id:     xxx-xxx-xxx
    health: HEALTH_ERR
            2 scrub errors
            Possible data damage: 2 pg inconsistent

message 日志信息

# egrep -i 'medium|i\/o error|sector|Prefailure' /var/log/messages
Jun 15 00:23:37 my-ceph-osd-host kernel: sd 0:2:6:0: [sdg] tag#0 Sense Key : Medium Error [current]
Jun 15 00:23:37 my-ceph-osd-host kernel: blk_update_request: critical medium error, dev sdg, sector 7541632
Jun 15 00:23:37 my-ceph-osd-host kernel: megaraid_sas 0000:1c:00.0: 63816 (771726199s/0x0002/FATAL) - Unrecoverable medium error during recovery on PD 05(e0x41/s5) at 731440
Jun 15 00:23:37 my-ceph-osd-host kernel: megaraid_sas 0000:1c:00.0: 63817 (771726201s/0x0001/FATAL) - Uncorrectable medium error logged for VD 06/6 at 731440 (on PD 05(e0x41/s5) at 731440)
Jun 15 00:30:55 my-ceph-osd-host kernel: sd 0:2:6:0: [sdg] tag#1 Sense Key : Medium Error [current]
Jun 15 00:30:55 my-ceph-osd-host kernel: blk_update_request: critical medium error, dev sdg, sector 7509376
Jun 15 00:30:55 my-ceph-osd-host kernel: megaraid_sas 0000:1c:00.0: 63822 (771726637s/0x0002/FATAL) - Unrecoverable medium error during recovery on PD 05(e0x41/s5) at 7296a0
Jun 15 00:30:55 my-ceph-osd-host kernel: megaraid_sas 0000:1c:00.0: 63823 (771726639s/0x0001/FATAL) - Uncorrectable medium error logged for VD 06/6 at 7296a0 (on PD 05(e0x41/s5) at 7296a0)
Jun 15 00:36:06 my-ceph-osd-host kernel: blk_update_request: I/O error, dev sdg, sector 7728512
Jun 15 00:36:07 my-ceph-osd-host kernel: blk_update_request: I/O error, dev sdg, sector 11491457792
Jun 15 00:36:07 my-ceph-osd-host kernel: blk_update_request: I/O error, dev sdg, sector 11491458304
Jun 15 00:36:07 my-ceph-osd-host kernel: blk_update_request: I/O error, dev sdg, sector 77630336
Jun 15 00:36:07 my-ceph-osd-host kernel: blk_update_request: I/O error, dev sdg, sector 77630848
Jun 15 00:36:07 my-ceph-osd-host kernel: blk_update_request: I/O error, dev sdg, sector 77631360
Jun 15 00:36:07 my-ceph-osd-host kernel: blk_update_request: I/O error, dev sdg, sector 77631872
Jun 15 00:36:07 my-ceph-osd-host kernel: blk_update_request: I/O error, dev sdg, sector 77632384

故障信息

  1. 当 ceph 检测到一个或多个对象副本不一致,则会标记对应 PG inconsistent 信息
  2. 可以理解为
    2.1 对象副本大小不一致
    2.2 对象在 recovery 完成后 miss 对应副本数量
  3. 通常都会在 PG 执行清晰(scrubbing)时候发现了对象副本一致性有问题

解决方法

  1. 由于上述 message 显示,某个 osd 对应的磁盘故障
  2. 下线对应 OSD
  3. 通过 ceph health detail 获得故障 PG 信息
  4. 执行 ceph pg repair PGID

相关文章:

  • 关于python的字节串与字符串的转换
  • 网络学习(15)|有http/1为什么还会有http/2
  • 第九章 Python 异常、模块与包
  • 爆赞!GitHub首本Python开发实战背记手册,标星果然百万名不虚传
  • vue中的自定义指令
  • element--el-table添加合计后固定列x轴滚动条无法滚动问题
  • ubuntu第三方库离线安装包(.deb离线安装方法;apt离线安装;离线安装deb)(docker离线安装、安装docker安装)
  • 人力资源招聘社会校企类型招聘系统校园招聘小程序
  • 全国第四轮软件工程学科评估结果
  • PHP表单设计:确保必需字段完整性的最佳实践
  • TDengine数据迁移
  • ffmpeg封装和解封装介绍-(8)解封装和封装重构
  • d3.js获取流程图不同的节点
  • LLaMA Factory多卡微调的实战教程(持续更新)
  • 数据库复习——范式(Normal Form)
  • 本地运行大语言模型(LLMs)
  • 瞬间将模型改为原来的60-200倍小
  • 拥抱未来:探索改变游戏规则的新存储技术
  • 关机充电动画:流程与定制
  • 架构师篇-1、总体架构设计
  • 上报集团社长李芸:发挥媒体优势,让中非民心在数字时代更深层互联互通
  • 图集|俄罗斯举行纪念苏联伟大卫国战争胜利80周年阅兵式
  • 方正证券总裁何亚刚到龄退休,54岁副总裁姜志军接棒
  • 中国证监会印发2025年度立法工作计划
  • “爱鸟周”为何不能像FI和花展那样“市区联动”
  • 马上评|比余华与史铁生的友情更动人的是什么