当前位置: 首页 > news >正文

ibping基本使用 以及 包丢失 超时 排障

1、ibping基本用法

第1步:获取目标机器的LID

机器B作为服务端,在机器B上执行:

# 获取机器B的LID号
ibstat | grep "Base lid" | awk '{print $3}' | head -1# 示例:3255不同网卡会有多个LID,切记根据自己需要的网卡LID进行ping

B机器上,启动监听

# 使用获取到的LID启动服务器
ibping -S $B_LID# 或者直接使用LID数值
# ibping -S 3290# 正确启动会显示
ibwarn: [port] : waiting for client to connect...

启动客户端(连接模式),在机器A上执行(作为客户端):

# 客户端输出(机器A)
---  (Lid 32XX) ibping statistics ---
4 packets transmitted, 4 received, 0% packet loss, time 3004 ms
rtt min/avg/max = 0.034/0.036/0.039 ms# 服务器端输出(机器B)  
ibwarn: [port] : client connected!
---  (Lid 32XX) ibping statistics ---
4 packets transmitted, 4 received, 0% packet loss, time 3004 ms

2、包丢失 超时 排障

ibping超时丢包基本排障项目如下,最好按顺序来,由上至下。

# 检查 OpenSM 服务状态
systemctl status opensmd# 检查 OpenSM 日志
tail -20 /var/log/opensm.log# 检查子网管理器信息
opensm --version# 查看子网信息
sudo opensm --dump | head -50# 检查本地 InfiniBand 状态
ibstat
ibstatus# 检查固件
mlxfwmanager# 检查本地端口状态
ibportstate# 检查子网管理器
sudo opensm --dump# 检查 InfiniBand 交换机连接
ibswitches# 检查 ARP 表
arp -n | grep -i ib# 检查 InfiniBand 接口
ip addr show | grep -E "(ib|infiniband)"# 检查 RDMA 状态
rdma link# 检查 Mellanox 设备
lspci | grep -i mellanox# 检查驱动加载
lsmod | grep -i mlx# 检查物理连接
sudo ethtool eth0  # 检查以太网状态# 检查网络路由
ip route show# 检查防火墙
sudo firewall-cmd --list-all# 测试基本的网络连通性
ping -c 4 <IP>

http://www.dtcms.com/a/360057.html

相关文章:

  • 【GPT入门】第62课 情感对话场景模型选型、训练与评测方法,整体架构设计
  • Redis核心原理与Java应用实践
  • 基于Seurat的空转单样本数据分析流程学习(一)
  • 性能优化三剑客:`memo`, `useCallback`, `useMemo` 详解
  • 7.1elementplus的表单
  • PyQt5 K线图实现与性能优化详解
  • 我的创作纪念日|一周年,上海-昆明-上海
  • QoS 基本原理与配置
  • 学生请假就餐系统
  • AI 赋能 Java 开发效率:全流程痛点解决与实践案例(二)
  • 使用cursor claude sonnet4的一些感受
  • 【系统分析师】高分论文:论原型法及其在系统开发中的应用
  • Langflow 框架中 Prompt 技术底层实现分析
  • LangChain中Prompt处理机制的技术架构与核心思想分析
  • [信号与系统个人笔记]第三章 连续时间信号与系统的频域分析
  • PPO、DPO和GRPO的区别
  • 【百度】C++开发(25届提前批 一面)面经
  • MongoDB 从零到入门:实用指南
  • 多租户配额与预算:限额、配额周期与突发桶的结算模型(Final)
  • juicefs+ceph rgw 存储安装
  • React 状态管理演进之路:从 Dva 到现代架构
  • leetcode 面试题 01.01.判定字符是否唯一
  • 解决浏览器的**混合内容安全策略**(Mixed Content Security Policy)带来的无法访问页面
  • 深入探讨JavaScript性能瓶颈:我的优化实战与思考
  • PBR 、 IPv6 PBR(基于策略的路由)原理与配置
  • 《济公》电视剧总结学习
  • 家庭全光组网高温故障深度分析与散热重构全记录
  • linux系统之----共享内存
  • 开学季,音频格式古诗词,也可作为启蒙教育。
  • C#异步编程