当前位置：首页 > news >正文

板卡如何安装在主机系统（刀片服务器或计算节点）

news 2025/10/6 12:21:01

✅ 板卡（如 GPU、FPGA）本身没有操作系统

它们是硬件加速器，不具备独立运行操作系统的能力。
它们需要依附于**主机系统（通常是刀片服务器或计算节点）**来运行。
操作系统（如 Linux）安装在主机上，主机通过驱动程序和运行时环境（如 CUDA、OpenCL）来调用这些加速卡。

🔗 这些卡如何与刀片服务器连接？

1. 本地直连（最常见）

GPU 或 FPGA 卡直接插在刀片服务器或计算节点的 PCIe 插槽 上。
这种方式延迟低、带宽高，是超算中最常见的连接方式。

2. 外部扩展（GPU Box / JBOG）

如果刀片服务器本身空间不足，可以通过 PCIe 扩展线缆 或 NVLink 连接外部 GPU 机箱（如 NVIDIA HGX、Supermicro GPU Box）。
这些扩展箱通过高速互联（如 PCIe Gen4/Gen5、CXL、NVLink）与主机通信。

3. 网络连接（较少见）

某些 FPGA 卡或智能网卡（如 SmartNIC）可以通过 以太网或 InfiniBand 与主机通信，适用于分布式计算或网络加速场景。

🧠 使用流程简化如下：

[GPU/FPGA 卡] ←PCIe/NVLink→ [刀片服务器] ←驱动/软件→ [操作系统]

用户编写的程序运行在操作系统上，调用驱动程序（如 NVIDIA 驱动）与加速卡通信。
加速卡执行计算任务并将结果返回主机。

🖼️ 简化结构图描述

这个结构图展示了：

刀片服务器作为主机，运行操作系统和驱动；
加速卡通过高速总线（如 PCIe 或 NVLink）连接到主机；
主机再通过网络或存储接口与其他节点或系统通信。

🖥️ 主机与板卡的关系

📌 举个例子

假设一个超算中心有一个机柜，里面安装了 10 台刀片服务器，每台服务器配有 4 张 NVIDIA A100 GPU 卡：

GPU 卡是插在每台服务器的主板上；
服务器是安装在机柜的托架上；
机柜通过电源和冷却系统保障这些服务器稳定运行。

查看全文

http://www.dtcms.com/a/321886.html

Linux之shell脚本入门

Unity基于Recoder的API写了一个随时录屏的工具

http状态码403，404，500等是什么意思？

Cursor CLI 来了,准备 Build anything

Sum of Three Values(sorting and searching)

全面了解selenium

RSA非对称加密

除了腾讯会议，私有化有哪些选择？

安科瑞EMS3.0源网荷储一体化解决方案全面助力零碳园区建设

FreeSWITCH parse-all-invite-headers

记一次lombok链式调用引发EasyExcel兼容性的问题

记录网站突然报错503

第六章第四节 PWM驱动LED呼吸灯 PWM驱动舵机 PWM驱动直流电机

计算机网络：到底什么是可变长子网掩码VLSM？

win11中Qt5.14.0+msvc2019+opencv4.9配置

全方位无限随机地图实现指南

模块 PCB 技术在未来通信领域的创新突破方向

Docker 创建镜像错误记录

Java技术栈/面试题合集(21)-Docker篇

如何动态执行 JS 脚本

揭秘Java synchronize：轻量级锁升级与偏向锁

Java-注解

重新 mybatis plus 的撒着OrUpdate 方法，实现根据自定义字段插入或者修改

P1044 [NOIP 2003 普及组] 栈

B4263 [GESP202503 四级] 荒地开垦题解

【工作笔记】Docker Desktop一直转圈加载不出来然后报错

提升LLM服务效率的秘密武器——vLLM！

Docker 安装 Redis

机柜中不同类型板卡的操作系统配置情况一览

解决苍穹外卖项目中 MyBatis - Plus 版本冲突问题