当前位置: 首页 > news >正文

达梦数据守护集群监视器详解与应用指南

一、DM 数据守护系统概述

在这里插入图片描述
达梦数据守护系统是保障数据库高可用性的核心组件,其架构主要由以下部分组成:

  • 主库/备库:承担读写和只读服务的数据节点
  • Redo 日志:记录数据库变更的核心日志
  • Redo 日志传输:主备库间的日志同步机制
  • Redo 日志重演:备库重做日志的应用过程
  • 守护进程 (dmwatcher):实例级别的监控和管理组件
  • 监视器 (dmmonitor):集群级别的监控和管理工具

监视器作为数据守护系统的重要组成部分,提供了集群监控、故障管理和状态确认等关键功能。

二、监视器核心功能解析

1. 监控数据守护系统

监视器实时接收守护进程发送的状态消息,完整展示主备库状态变化和故障切换过程中数据库模式、状态的转换过程。

2. 管理数据守护系统

用户可通过监视器命令启停守护进程监控功能,执行主备库切换、备库故障接管等操作。

3. 确认状态信息

在故障自动切换场景下,监视器提供状态确认机制,避免因网络故障导致的脑裂问题。

4. 发起故障自动接管

当主库发生故障时,监视器自动选择符合条件的备库并通知其执行接管操作。

三、监视器常用命令详解

3.1 集群状态查看:show 命令

启动监视器:

/opt/dmdbms/bin/dmmonitor /opt/dmdbms/bin/dmmonitor.ini

查看集群状态:

show

关键字段解析:

组全局信息
  • GROUP:守护进程组名
  • OGUID:守护进程组唯一标识
  • MON_CONFIRM:确认模式标识(TRUE/FALSE)
  • MODE:切换模式(AUTO/MANUAL)
  • MPP_FLAG:MPP 环境标识
库全局信息
  • DW_IP:守护进程内网IP
  • MAL_DW_PORT:守护进程监听端口
  • INST_IP:数据库对外服务IP
  • INST_PORT:数据库对外服务端口
守护进程信息
  • WTIME:守护进程本地时间
  • WTYPE:守护类型(LOCAL/GLOBAL)
  • WSTATUS:守护进程状态
  • INAME:实例名称
  • ISTATUS:数据库状态(Open/Mount等)
  • IMODE:数据库模式(Primary/Standby)
实例信息
  • INST_OK:实例状态(OK/ERROR)
  • FSEQ/FLSN:已写入日志的序列号/LSN
  • CSEQ/CLSN:当前系统序列号/LSN

监控要点:

  • 确认所有实例 INST_OK 状态为 OK
  • 确认所有数据库 ISTATUS 为 OPEN
  • 确认主备模式 IMODE 为 Primary/Standby

3.2 其他常用命令

1. list 命令

查看守护进程配置信息:

list

输出内容包括守护类型、运行模式、超时时间、实例启动命令等关键配置参数。
在这里插入图片描述

2. show global info 命令

查看所有实例组的信息:

show global info

在这里插入图片描述

3. tip 命令

查看集群当前运行状态概要:

tip

该命令提供集群健康状态的简要评估,特别会提示监视器是否为确认模式。
在这里插入图片描述

4. choose switchover 命令

查看可切换为主库的实例列表:

choose switchover GRP1

在这里插入图片描述

5. switchover 命令

执行主备切换操作:

switchover GRP1.GRP1_RT_01

该命令会触发完整的切换流程,包括:

  • 守护进程状态切换
  • 数据库模式变更
  • 归档状态调整
  • 数据库重新打开

四、实战经验分享

1. 日常监控要点

建议定期检查以下关键指标:

  • 主备库同步状态(RSTAT 应为 VALID)
  • 日志应用延迟(FSEQ/CSEQ 差值)
  • 网络连通性(INST_OK 状态)

2. 故障处理流程

  1. 使用 show 命令确认当前状态
  2. 通过 tip 命令获取系统提示
  3. 根据情况选择手动切换或故障接管
  4. 监控切换过程,确认所有实例恢复正常

3. 注意事项

  • 非确认模式的监视器无法执行自动故障接管
  • 切换前确保备库数据同步状态正常
  • 网络分区时谨慎操作,避免脑裂

五、总结

达梦数据守护集群监视器是维护数据库高可用性的关键工具。通过熟练掌握 show、list、tip 等监控命令,以及 choose switchover、switchover 等管理命令,数据库管理员可以有效保障集群的稳定运行,及时处理各类故障场景。

在实际运维中,建议结合监控告警系统,对关键指标进行持续监控,并建立完善的应急预案,确保在故障发生时能够快速响应和处理,最大限度保障业务的连续性和数据的安全性。


文章转载自:

http://Br5tnHQD.nqbcj.cn
http://lRfIbHgG.nqbcj.cn
http://oPxXNfiF.nqbcj.cn
http://j3KpHjK4.nqbcj.cn
http://glC0fr4F.nqbcj.cn
http://3jX3k68E.nqbcj.cn
http://tj8ZaIr1.nqbcj.cn
http://tt1v7Xbk.nqbcj.cn
http://o2s7Bp0u.nqbcj.cn
http://gCow5AeV.nqbcj.cn
http://eADVAZIE.nqbcj.cn
http://GaFd1xAn.nqbcj.cn
http://KbAAMeUH.nqbcj.cn
http://yaW6B2lr.nqbcj.cn
http://tIRB5jJm.nqbcj.cn
http://eoxcBbtR.nqbcj.cn
http://ZZG8w0QO.nqbcj.cn
http://2nJ4ssdR.nqbcj.cn
http://aM1eFjin.nqbcj.cn
http://eM43hmpq.nqbcj.cn
http://pbnFeUsT.nqbcj.cn
http://AsIXbL1x.nqbcj.cn
http://3RlJC39J.nqbcj.cn
http://G0v5eScd.nqbcj.cn
http://gwPPkiqG.nqbcj.cn
http://BzKKADQl.nqbcj.cn
http://SgeTQ3Hi.nqbcj.cn
http://IgS6QISc.nqbcj.cn
http://l0iyVXuH.nqbcj.cn
http://9zDzXbvJ.nqbcj.cn
http://www.dtcms.com/a/369211.html

相关文章:

  • Oracle 数据库:视图与索引
  • 如何理解`(line_status = parse_line()) == LINE_OK`?
  • 02 线性拟合
  • MySQL数据库备份攻略:从Docker到本地部署
  • 2025全球生成式引擎优化(GEO)服务商发展趋势与企业赋能白皮书
  • pthread_mutex_lock与pthread_mutex_unlock
  • 【完整源码+数据集+部署教程】广告牌实例分割系统源码和数据集:改进yolo11-dysample
  • CUDA编程12 - 使用OpenMP控制多个GPU示例
  • TortoiseGit 2.4.0.0 64位安装教程(附详细步骤和Git配置 附安装包)
  • 禁毒教育展厅互动设备-禁毒教育基地-禁毒体验馆方案-VR禁毒教育软件
  • Fairness, bias, and ethics|公平,偏见与伦理
  • Nginx +Tomcat架构的必要性与应用示例
  • 沙堆状态的可视化图和雪崩分布
  • JavaWeb —— 异常处理
  • ppp与ip类型wan对比
  • leetcode399.除法求值
  • 电磁波成像(X射线、CT成像)原理简介
  • RikkaHub:安卓原生AI聊天新体验
  • Linux之Ubuntu桌面化操作系统的安装
  • CASToR 生成的文件进行转换
  • AI架构师的思维方式与架构设计原则
  • 软考 系统架构设计师系列知识点之杂项集萃(140)
  • 修改上次提交的Git提交日志
  • 【可信数据空间-连接器状态监控-Java代码集成】
  • C语言(长期更新)第15讲 指针详解(五):习题实战
  • 全球汽车氮化镓技术市场规模将于2031年增长至180.5亿美元,2025-2031年复合增长率达94.3%,由Infineon和Navitas驱动
  • .Net程序员就业现状以及学习路线图(四)
  • 垃圾回收算法详解
  • 【QT 5.12.12 打包-Windows 平台下】
  • 2025高教社数学建模国赛B题 - 碳化硅外延层厚度的确定(完整参考论文)