当前位置: 首页 > news >正文

板卡如何安装在主机系统(刀片服务器或计算节点)

✅ 板卡(如 GPU、FPGA)本身没有操作系统

  • 它们是硬件加速器,不具备独立运行操作系统的能力。
  • 它们需要依附于**主机系统(通常是刀片服务器或计算节点)**来运行。
  • 操作系统(如 Linux)安装在主机上,主机通过驱动程序和运行时环境(如 CUDA、OpenCL)来调用这些加速卡。

🔗 这些卡如何与刀片服务器连接?

1. 本地直连(最常见)
  • GPU 或 FPGA 卡直接插在刀片服务器或计算节点的 PCIe 插槽 上。
  • 这种方式延迟低、带宽高,是超算中最常见的连接方式。
2. 外部扩展(GPU Box / JBOG)
  • 如果刀片服务器本身空间不足,可以通过 PCIe 扩展线缆 或 NVLink 连接外部 GPU 机箱(如 NVIDIA HGX、Supermicro GPU Box)。
  • 这些扩展箱通过高速互联(如 PCIe Gen4/Gen5、CXL、NVLink)与主机通信。
3. 网络连接(较少见)
  • 某些 FPGA 卡或智能网卡(如 SmartNIC)可以通过 以太网或 InfiniBand 与主机通信,适用于分布式计算或网络加速场景。

🧠 使用流程简化如下:

[GPU/FPGA 卡] ←PCIe/NVLink→ [刀片服务器] ←驱动/软件→ [操作系统]
  • 用户编写的程序运行在操作系统上,调用驱动程序(如 NVIDIA 驱动)与加速卡通信。
  • 加速卡执行计算任务并将结果返回主机。

🖼️ 简化结构图描述

这个结构图展示了:

  • 刀片服务器作为主机,运行操作系统和驱动;
  • 加速卡通过高速总线(如 PCIe 或 NVLink)连接到主机;
  • 主机再通过网络或存储接口与其他节点或系统通信。

🖥️ 主机与板卡的关系

📌 举个例子

假设一个超算中心有一个机柜,里面安装了 10 台刀片服务器,每台服务器配有 4 张 NVIDIA A100 GPU 卡:

  • GPU 卡是插在每台服务器的主板上;
  • 服务器是安装在机柜的托架上;
  • 机柜通过电源和冷却系统保障这些服务器稳定运行。
http://www.dtcms.com/a/321886.html

相关文章:

  • Linux之shell脚本入门
  • Unity基于Recoder的API写了一个随时录屏的工具
  • http状态码403,404,500等是什么意思?
  • Cursor CLI 来了,准备 Build anything
  • Sum of Three Values(sorting and searching)
  • 全面了解selenium
  • RSA非对称加密
  • 除了腾讯会议,私有化有哪些选择?
  • 安科瑞EMS3.0源网荷储一体化解决方案 全面助力零碳园区建设
  • FreeSWITCH parse-all-invite-headers
  • 记一次lombok链式调用引发EasyExcel兼容性的问题
  • 记录网站突然报错503
  • 第六章第四节 PWM驱动LED呼吸灯 PWM驱动舵机 PWM驱动直流电机
  • 计算机网络:到底什么是可变长子网掩码VLSM?
  • win11中Qt5.14.0+msvc2019+opencv4.9配置
  • 全方位无限随机地图实现指南
  • 模块 PCB 技术在未来通信领域的创新突破方向
  • Docker 创建镜像错误记录
  • Java技术栈/面试题合集(21)-Docker篇
  • 如何动态执行 JS 脚本
  • 揭秘Java synchronize:轻量级锁升级与偏向锁
  • Java-注解
  • 重新 mybatis plus 的 撒着OrUpdate 方法,实现根据自定义字段插入或者修改
  • P1044 [NOIP 2003 普及组] 栈
  • B4263 [GESP202503 四级] 荒地开垦 题解
  • 【工作笔记】Docker Desktop一直转圈加载不出来然后报错
  • 提升LLM服务效率的秘密武器——vLLM!
  • Docker 安装 Redis
  • 机柜中不同类型板卡的操作系统配置情况一览
  • 解决苍穹外卖项目中 MyBatis - Plus 版本冲突问题