当前位置：首页 > news >正文

Ubuntu 单机多卡部署脚本： vLLM + DeepSeek 70B

news 2025/11/4 6:54:00

# 部署脚本：Ubuntu + vLLM + DeepSeek 70B

# 执行前请确保：1. 系统为 Ubuntu 20.04/22.04 2. 拥有NVIDIA显卡(显存≥24G)

# 系统更新与基础依赖

sudo apt update && sudo apt upgrade -y

sudo apt install -y build-essential python3-pip curl git wget

# NVIDIA驱动安装(需重启)

#sudo add-apt-repository ppa:graphics-drivers/ppa -y

#sudo apt update

#sudo apt install -y nvidia-driver-550-server

echo "请手动重启系统后再次执行本脚本！"

exit 0 # 首次执行到此退出

# ---- 以下为重启后执行的第二部分 ----

#pip 使用国内源
mkdir -p $HOME/.pip/

cat <<EOF
index-url = http://mirrors.aliyun.com/pypi/simple/

[install]
trusted-host=mirrors.aliyun.com
EOF >$HOME/.pip/pip.conf

# Miniconda安装

# wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 使用国内源
wget -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda

source $HOME/miniconda/bin/activate

# 创建虚拟环境

conda create -n vllm python=3.11 -y

conda activate vllm

# 安装核心组件

pip install vllm huggingface_hub modelscope

# 模型下载示例(替换为实际模型ID)

MODEL_ID="deepseek-ai/DeepSeek-R1-Distill-Llama-70B"

python - <<EOF

from modelscope import snapshot_download

snapshot_download('$MODEL_ID', cache_dir='./models')

EOF

# 启动服务(根据GPU数量调整tensor-parallel-size)

vllm serve --model ./models/$MODEL_ID \

--tensor-parallel-size 4 \

--gpu-memory-utilization 0.95 \

--port 6006 \

--max-model-len 8192

# 单机多卡,这里的 --tensor-parallel-size 参数为 4 ,直接用4卡、也可以用8卡用8

http://www.dtcms.com/a/176313.html

相关文章：

游戏引擎学习第262天:绘制多帧性能分析图

MySQL的深度分页如何优化?

ESP32开发入门(五)：WiFi 开发实践

0509滴滴前端项目常见内容

ElementUI 表格el-table自适应高度设置

007 Linux 开发工具（上）—— vim、解放sudo、gc+

Golang 接口 vs Rust Trait：一场关于抽象的哲学对话

LeetCode383_赎金信

Jenkins 服务器上安装 Git

Apache Calcite 详细介绍

【EasyPan】loadDataList方法及checkRootFilePid方法解析

comfyui 实现中文提示词翻译英文进行图像生成

VScode一直处于循环“正在重新激活终端“问题的解决方法

【上位机——MFC】序列化机制

机器学习在信用卡欺诈检测中的应用思考

基于英特尔 RealSense D455 结构光相机实现裂缝尺寸以及深度测量

svn服务器迁移

使用VSCode在Windows 11上编译运行项目

Mybatis标签使用 -association 绑定对象，collection 绑定集合

【背包dp----01背包】例题三------（标准的01背包+变种01背包1【恰好装满背包体积产生的最大价值】）

【ROS2】Nav2源码之行为树定义、创建、加载

【论文阅读】Attentive Collaborative Filtering:

缓存替换算法与存储器管理的分页、分段、段页式管理联系

培训机构用的教务系统

如何延长电脑使用寿命？

神经网络在模式识别中的应用：从语音到视觉的智能解析

react中的用法——setDisabled dva dispatch effects

更新编译器到ARM compiler6，很多报错问题

FPGA 不兼容故障及处理

人工智能数据标注服务规范