当前位置: 首页 > news >正文

Ubuntu 单机多卡部署脚本: vLLM + DeepSeek 70B


# 部署脚本:Ubuntu + vLLM + DeepSeek 70B

# 执行前请确保:1. 系统为 Ubuntu 20.04/22.04  2. 拥有NVIDIA显卡(显存≥24G)

# 系统更新与基础依赖

sudo apt update && sudo apt upgrade -y

sudo apt install -y build-essential python3-pip curl git wget

# NVIDIA驱动安装(需重启)

#sudo add-apt-repository ppa:graphics-drivers/ppa -y

#sudo apt update

#sudo apt install -y nvidia-driver-550-server

echo "请手动重启系统后再次执行本脚本!"

exit 0  # 首次执行到此退出


 


# ---- 以下为重启后执行的第二部分 ----


#pip 使用国内源
mkdir -p $HOME/.pip/

cat  <<EOF
index-url = http://mirrors.aliyun.com/pypi/simple/

[install]
trusted-host=mirrors.aliyun.com 
EOF >$HOME/.pip/pip.conf


# Miniconda安装

# wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 使用国内源
wget -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda

source $HOME/miniconda/bin/activate


# 创建虚拟环境

conda create -n vllm python=3.11 -y

conda activate vllm

# 安装核心组件

pip install vllm huggingface_hub modelscope

# 模型下载示例(替换为实际模型ID)

MODEL_ID="deepseek-ai/DeepSeek-R1-Distill-Llama-70B"

python - <<EOF

from modelscope import snapshot_download

snapshot_download('$MODEL_ID', cache_dir='./models')

EOF

# 启动服务(根据GPU数量调整tensor-parallel-size)

vllm serve --model ./models/$MODEL_ID \

  --tensor-parallel-size 4 \

  --gpu-memory-utilization 0.95 \

  --port 6006 \

  --max-model-len 8192

# 单机多卡,这里的 --tensor-parallel-size 参数为 4 ,直接用4卡、也可以用8卡用8

相关文章:

  • 游戏引擎学习第262天:绘制多帧性能分析图
  • MySQL的深度分页如何优化?
  • ESP32开发入门(五):WiFi 开发实践
  • 0509滴滴前端项目常见内容
  • ElementUI 表格el-table自适应高度设置
  • 007 Linux 开发工具(上)—— vim、解放sudo、gc+
  • Golang 接口 vs Rust Trait:一场关于抽象的哲学对话
  • LeetCode383_赎金信
  • Jenkins 服务器上安装 Git
  • Apache Calcite 详细介绍
  • 【EasyPan】loadDataList方法及checkRootFilePid方法解析
  • comfyui 实现中文提示词翻译英文进行图像生成
  • VScode一直处于循环“正在重新激活终端“问题的解决方法
  • 【上位机——MFC】序列化机制
  • 机器学习在信用卡欺诈检测中的应用思考
  • 基于英特尔 RealSense D455 结构光相机实现裂缝尺寸以及深度测量
  • svn服务器迁移
  • 使用VSCode在Windows 11上编译运行项目
  • Mybatis标签使用 -association 绑定对象,collection 绑定集合
  • 【背包dp----01背包】例题三------(标准的01背包+变种01背包1【恰好装满背包体积 产生的 最大价值】)
  • 明星同款撕拉片,为何能炒到三四百一张?
  • 复旦大学文科杰出教授裘锡圭逝世,享年90岁
  • 一企业采购国产化肥冒充“挪威化肥”:7人被抓获
  • 家庭相册㉙在沪打拼25年,我理解了父母清晨去卖蜜饯的辛苦
  • 中国中古史集刊高质量发展论坛暨《唐史论丛》创刊四十周年纪念会召开
  • 金融监管局:已设立74支私募股权投资基金,支持投资科技创新企业