当前位置: 首页 > news >正文

配置 NVIDIA RTX 5090 + sm_120 + flashattention,已跑通一个大模型 ~~

我的配置:
系统版本 ubuntu 22.04
显卡驱动版本 CUDA Version: 13.0
cudatoolkit: 12.9
pytorch:2.9.0.dev20250815+cu129

1. 显卡驱动安装:CUDA驱动+CUDA Toolkit

强烈建议全程参照这个教程安装:50系显卡在Ubuntu22.04环境下安装nvidia驱动+CUDA+cuDNN,anaconda下配置pytorch环境一站式解决方案(2025年7月版本)已完结!!!

几个注意事项:

1.1 CUDA驱动相关

1. nvidia显卡驱动安装有多种途径:

比如可以使用ubuntu 系统自带的“软件和更新”程序-附加驱动更新进行驱动安装,或使用apt命令指定版本安装;

2. 注意禁用系统自带驱动,防止与新驱动发生冲突

查看 nouveau是否禁用成功,终端输入:

  lsmod | grep nouveau

如果没有返回值,则说明禁用成功。 否则参考教程完成禁用系统自带驱动。

3. 验证驱动是否已经成功安装,

终端输入:

nvidia-smi

如果成功安装会出现以下界面,50系显卡目前支持CUDA最低版本为12.8,且为了适配RTX5090的sm_120算力,本文安装版本选择 CUDA驱动≥12.9。在这里插入图片描述

1.2. CUDA Toolkit相关

1. CUDA Toolkit 版本12.9,不然运行大模型时,flashattention报错

网址: CUDA Toolkit 12.9 Downloads

两步:CUDA Toolkit Installer 和 Driver Installer 两部分都要装哦~
在这里插入图片描述

2. 记得配置环境变量,否则nvcc -V还是显示没有nvcc指令,

打开bashrc文件:

sudo gedit ~/.bashrc

在末尾添加如下语句:

export PATH="/usr/local/cuda-12.9/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-12.9/lib64:$LD_LIBRARY_PATH"

添加后退出并保存,更新环境变量:

source ~/.bashrc

关于上面的一个知识点:众所周知,打开新的终端才会自动配置~/.bashrc中的环境变量,所以,为了使修改后的~/.bashrc生效,要么重新打开一个终端使~/.bashrc自动生效,要么在当前终端source 一下~/.bashrcsource ~/.bashrc是后者。
输入nvcc -V验证
在这里插入图片描述
至此CUDA安装完成。

1.3. 安装成功验证

```bash
(base) xj@xj:~$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Wed_Apr__9_19:24:57_PDT_2025
Cuda compilation tools, release 12.9, V12.9.41
Build cuda_12.9.r12.9/compiler.35813241_0
(base) xj@xj:~$ nvidia-smi
Sun Aug 17 13:55:18 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 580.65.06              Driver Version: 580.65.06      CUDA Version: 13.0     |
+-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 5090        On  |   00000000:01:00.0  On |                  N/A |
| 53%   71C    P1            536W /  600W |   20005MiB /  32607MiB |     94%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
```

2. Pytorch环境配置(重点!!)

这一部分我会基于anaconda进行环境配置,anaconda安装教程较多,且不会踩坑,请自行找教程安装。

2.1. 背景

这一部分要重点注意就是官方wheel(比如pip install https://github.com/Dao-AILab/flash-attention/releases/download/v2.5.8/flash_attn-2.5.8+cu122torch2.3cxx11abiFALSE-cp310-cp310-linux_x86_64.whl这种pip一键安装方式)安装pytorch后报错:

(vlm) xj@xj:~$ python 
Python 3.10.14 (main, May 6 2
http://www.dtcms.com/a/336662.html

相关文章:

  • clion 如何调试 redis(在 mac 上)
  • AMBA-AXI and ACE协议详解(三)
  • 期望分位数回归模型
  • 利用pypy加速pyxlsbwriter生成xlsb文件
  • 五、redis入门 之 客户端连接redis
  • 日语学习-日语知识点小记-进阶-JLPT-N1阶段蓝宝书,共120语法(3):21-30语法
  • 雷卯针对香橙派Orange Pi Kunpeng Pro开发板防雷防静电方案
  • CloudBeaver:基于浏览器的DBeaver
  • 机器学习案例——对好评和差评进行预测
  • 当AI替我“搬砖”,我的价值是什么?
  • 21.AlexNet
  • 金山办公的服务端开发工程师-25届春招部分笔试题
  • C# Newtonsoft.Json 反序列化子类数据丢失问题
  • DBeaver连接MySQL 8报错连接丢失
  • HTTP协议-3-HTTP/2是如何维持长连接的?
  • JAVA后端开发——Token自动续期机制的必要性
  • 【Linux内核】Linux信号机制
  • 【Linux】五种IO模型
  • JVM学习笔记-----StringTable
  • react 错误边界
  • Python 内置模块 collections 常用工具
  • 【撸靶笔记】第二关:GET -Error based -Intiger based
  • Spring Framework :IoC 容器的原理与实践
  • CW32L011_电机驱动器开发板试用
  • 工作中使用到的时序指标异常检测算法 TRPS 【Temporal Residual Pattern Similarity】和 K-sigma 算法
  • 区块链:数字时代信任基石的构建与创新
  • 25年第十本【金钱心理学】
  • 1. Docker的介绍和安装
  • 洛谷 P2324 [SCOI2005] 骑士精神-提高+/省选-
  • CE桥接MuMu模拟器