当前位置: 首页 > news >正文

二、OpenSM排障----实战生产

目录

一、确认 OpenSM 服务端故障的步骤

1. 检查客户端与服务器的连通性

2. 检查客户端 InfiniBand 接口状态

3. 检查子网管理器状态

4. 检查拓扑信息

5. 检查路由表

二、客户端日志位置及查看方法

1. 系统日志

2. OpenSM 客户端日志

3. 内核日志

4. 性能计数器日志

三、常见故障场景及解决方法

1. 服务器端 OpenSM 未启动

2. 服务器端 OpenSM 配置错误

3. 网络链路故障

4. 客户端驱动或固件问题

四、总结


当 OpenSM 服务端故障时,客户端可能无法正常访问 InfiniBand 网络。以下是排障步骤,帮助确认是否是服务器故障,以及如何查看客户端日志。


一、确认 OpenSM 服务端故障的步骤

1. 检查客户端与服务器的连通性
    http://www.dtcms.com/a/15454.html

    相关文章:

  • 深入解析哈希表:原理、实现与应用
  • 基于vue3实现的课堂点名程序
  • 通俗易懂唠唠SOME/IP——SOME/IP错误处理
  • 机器学习核心算法解析
  • 【Qt】:概述(下载安装、认识 QT Creator)
  • 软件检测CNAS认可程序文件之检测环境管理程序分享
  • 二叉树详解:Java实现与应用
  • Matlab 机器人 雅可比矩阵
  • shell脚本的一些学习笔记----(三)流程控制
  • llama.cpp部署 DeepSeek-R1 模型
  • 滚珠花键润滑脂的作用!
  • 为AI聊天工具添加一个知识系统 之102 详细设计之43 自性三藏 之3 祖传代码
  • 机器学习:多项式回归
  • Linux之【网络I/O】前世今生(二)
  • Spring生态体系深度解析:现代Java开发的核心架构
  • IoTDB 导入数据时提示内存不足如何处理
  • 【深度强化学习】策略梯度算法:REINFORCE
  • 【ISO 14229-1:2023 UDS诊断全量测试用例清单系列:第二十节】
  • Deepseek与GPT都还是人机环境系统智能的初级产品
  • 3D可视化定制:开启个性化消费新时代
  • npm包管理工具
  • Linux中退出vi编辑器的命令
  • 全面理解-c++11中的智能指针
  • C语言初阶牛客网刷题——JZ65 不用加减乘除做加法】【难度:简单】
  • SAIL-RK3576单板运行7b的deepseek对话模型
  • uvm错误记录4
  • wps接入DeepSeek教程
  • 本地安装了mysql导致phpstudy无法启动
  • 解锁OCP认证:通往数据库精英之路
  • 微软AutoGen高级功能——Memory