当前位置：首页 > news >正文

nvidia 各 GPU 架构匹配的 CUDA arch 和 CUDA gencode

news 2025/10/16 19:08:32

使用 NVCC 进行编译 cuda c(.cu)时，arch 标志 (-arch) 指定了 CUDA 文件将为其编译的 NVIDIA GPU 架构的名称。
Gencodes (-gencode) 允许更多的 PTX 代，并且可以针对不同的架构重复多次。

NVIDIA 架构名称的列表，以及它们具有的计算能力：

Fermi	Kepler	Maxwell	Pascal	Volta	Turing	Ampere	Lovelace	Hopper
sm_20	sm_30	sm_50	sm_60	sm_70	sm_75	sm_80	sm_90	sm_100
	sm_35	sm_52	sm_61	sm_72		sm_86
	sm_37	sm_53	sm_62

什么时候应该使用不同的gencodes或cuda arch？

当编译 CUDA 代码时，应该始终只编译一个-arch与最常用的 GPU 卡匹配的标志。这将实现更快的运行时，因为代码生成将在编译期间发生。
如果只提及-gencode，而忽略-arch标志，则 CUDA 驱动程序将在JIT编译器上生成 GPU 代码。

当想要加速 CUDA 编译时，想要减少不相关的 -gencode 标志的数量。但是，有时可能希望通过添加更全面的 -gencode 标志来获得更好的 CUDA 向后兼容性。

边缘检测技术现状初探1

UML之扩展用例

open3d教程（三）点云的显示

【蓝桥杯每日一题】4.1

SAP SCC安装配置

Excel去掉单元格里面的换行的方法

Tiktok矩阵运营中使用云手机的好处

Mysql之Redo log（Red log of MySQL）

黑白彩色相机成像原理

嘿嘿，好久不见

解码 @property - 属性管理的艺术

搜索算法-------DFS练习1

C 语言 --- 指针 1

Vue2（12）表单输入绑定学习笔记

数据库——MySQL连接表

Bevformer环境配置

数据处理专题（六）

SQL、mySQL与SQLite简单理解

2025.4.1英语听力