TensorFlow项目GPU运行 安装步骤
步骤1:创建新环境并指定Python版本
conda create -n tf_gpu python=3.9 -y conda activate tf_gpu
步骤2:使用NVIDIA官方频道安装
conda install -c "nvidia/label/cuda-12.0.0" cuda-toolkit cudnn=8.9 -y
步骤3:验证CUDA安装
# 检查CUDA版本 nvcc --version # 应显示12.0 # 检查cuDNN cat $CONDA_PREFIX/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
步骤4:安装TensorFlow
pip install tensorflow==2.13.0
步骤5:设置环境变量
echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib/' >> ~/.bashrc source ~/.bashrc
步骤6:验证GPU可用性
import tensorflow as tf print("TensorFlow版本:", tf.__version__) print("GPU是否可用:", tf.config.list_physical_devices('GPU'))
备选方案(如果仍遇到依赖冲突):
-
使用mamba加速依赖解析
conda install -n base -c conda-forge mamba -y mamba create -n tf_gpu python=3.9 cudatoolkit=12.0 cudnn=8.9 -c conda-forge -y
-
使用Docker容器(推荐)
docker pull tensorflow/tensorflow:2.13.0-gpu docker run -it --gpus all tensorflow/tensorflow:2.13.0-gpu bash
关键配置说明:
-
使用
nvidia/label/cuda-12.0.0
频道确保获得官方认证的CUDA 12.0组件 -
cudnn=8.9
会自动匹配兼容版本(如8.9.2) -
显式指定Python 3.9避免新版Python的兼容性问题
常见问题排查:
如果出现cudnn_version.h
找不到的错误,执行:
bash
复制
conda install -c conda-forge cudnn=8.9 -y