centos7安装NVIDIA显卡
装备工作
我的系统版本
cat /etc/centos-release
CentOS Linux release 7.9.2009 (Core)
内核版本
rpm -q kernel
或者
rpm -qa|grep kernel
kernel-3.10.0-1160.el7.x86_64
注意以上输出内核版本,按照我下面的操作步骤,不会出问题。否则重装系统都有可能。
linux官方还在维护的最低版本是5.4.292linux内核
我先前升级内核,由于误操作已经重装了系统。所以我就不折腾了。
安装基础依赖
yum install gcc
yum install gcc-c++
安装内核文件
一定要安装当版本的文件,uname -r至关重要,否则系统重启后,会有多个引导文件
yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
禁用默认驱动
执行以下命令,查看是否有输出
lsmod | grep nouveau
如果没有输出,则禁用成功。不成功执行下面方法:
vim /lib/modprobe.d/dist-blacklist.conf
#blacklist nvidiafb
blacklist nouveau
options nouveau modeset=0
重启内核
dracut -force
再次执行lsmod | grep nouveau查看是否有输出
上传驱动
查看显卡型号
lspci | grep -i vga
输出
03:00.0 VGA compatible controller: Matrox Electronics Systems Ltd. Integrated Matrox G200eW3 Graphics Controller (rev 04)
31:00.0 VGA compatible controller: NVIDIA Corporation Device 24b0 (rev a1)
集成显卡(Integrated)为G200eW3
独立显卡为24b0,安装独立显卡的驱动
厂商提供的型号
下载RTXA4000的驱动
nvidia网站下载地址
根据自己电脑系统选择相应版本
查看电脑CPU架构
uname -m
输出
x86_64
下载64位版本
选择版本
因为centos7的内核太老了,最新版本是不支持的。升级内核肯定会有兼容性问题,最新版本建议用Centos Stream 9
我下载的是550.163.01版本
上传驱动到服务器,并赋予权限
chmod a+x NVIDIA-Linux-x86_64-550.163.01.run
安装驱动
双显卡混合环境,只安装驱动,不安装OpenGL,避免与集成显卡冲突
./NVIDIA-Linux-x86_64-550.163.01.run --no-opengl-files
鼠标左右移动选择NVIDIA Proprietary
选择No
选择Rebuild inittramfs
选怎Yes
安装完成后查看是否成功
nvidia-smi
如果想重新装其他版本,需要先执行卸载命令
./NVIDIA-Linux-x86_64-550.1 --uninstall
重启系统
reboot
安装CUDA
下载地址:cuda-toolkit-archive
选择CUDA对应版本下载,版本号nvidia-smi命令已显示,上图显示CUDA Version:12.4
下面下载的版本,不能超过此版本号
wget https://developer.download.nvidia.com/compute/cuda/12.4.1/local_installers/cuda_12.4.1_550.54.15_linux.run
安装
chmod a+x cuda_12.4.1_550.54.15_linux.run
sh cuda_12.4.1_550.54.15_linux.run
会等待很长时间,然后输入accept即可
因为已经安装过驱动了,按Enter健取消Driver前的X,然后移动到Install处安装即可
等待一段时间输出如下,即为成功
Driver: Not Selected
Toolkit: Installed in /usr/local/cuda-12.4/
Please make sure that
- PATH includes /usr/local/cuda-12.4/bin
- LD_LIBRARY_PATH includes /usr/local/cuda-12.4/lib64, or, add /usr/local/cuda-12.4/lib64 to /etc/ld.so.conf
and run ldconfig as rootTo uninstall the CUDA Toolkit, run cuda-uninstaller in
/usr/local/cuda-12.4/bin
***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 550.00 is required for
CUDA 12.4 functionality to work. To install the driver using this
installer, run the following command, replacing with
the name of this run file:
sudo .run --silent --driverLogfile is /var/log/cuda-installer.log
配置CUDA环境变量
vim ~/.bashrc
export PATH=/usr/local/cuda-12.4/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda
使配置生效
source ~/.bashrc
查看cuda信息
nvcc -V
nvcc: NVIDIA ® Cuda compiler driver
Copyright © 2005-2024 NVIDIA Corporation
Built on Thu_Mar_28_02:18:24_PDT_2024
Cuda compilation tools, release 12.4, V12.4.131
Build cuda_12.4.r12.4/compiler.34097967_0
验证
/usr/local/cuda/extras/demo_suite/deviceQuery
最后两行输出
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 12.4, CUDA Runtime Version = 12.4, NumDevs = 1, Device0 = NVIDIA RTX A4000
Result = PASS
安装CUDNN
下载地址cudnn-archive
选择CUDA对应版本号,需要注册登录
安装
tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz
cd cudnn-linux-x86_64-8.9.7.29_cuda12-archive/
cp include/cudnn*.h /usr/local/cuda/include
cp -P lib/libcudnn* /usr/local/cuda/lib64
chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
验证
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
参照
https://www.cnblogs.com/sheepships/p/18072617
https://blog.csdn.net/Mr_kka/article/details/143911821