当前位置: 首页 > news >正文

windows10安装WSL2 ubuntu24.04中安装vLLM vLLM中部署Qwen2.5-VL

文章目录

  • 一、安装WSL2
    • 下载 wsl.x64.msi 并安装
    • 登录WSL
    • Ubuntu 24.04 迁移到 D 盘
  • 二、安装uv
  • 三、创建虚拟环境并安装vLLM
  • 四、测试Qwen2.5-VL模型的效果
    • 1. 下载Qwen2.5-VL模型
    • 2. 注


本文记录下,如何使用vLLM部署模型。安装教程参考视频教程:https://www.bilibili.com/video/BV1BijSzfEmQ/。由于vLLM只支持Linux操作系统,所以首先安装WSL2。

一、安装WSL2

在管理员模式下打开CMD,输入 wsl --install ,然后重新启动计算机。点击此处可查看微软官方文档。

下载 wsl.x64.msi 并安装

实际上,用上述指令下载是很慢的,我们可以手动下载 WSL 安装包。访问网址 https://github.com/microsoft/WSL/releases 即可下载。按下图安装即可。
在这里插入图片描述
在这里插入图片描述

WSL2安装好了,可以使用wsl.exe --list --online查看支持的操作系统。接下来安装ubuntu24.04:wsl.exe --install Ubuntu-24.04。这个下载速度就快多了。
在这里插入图片描述
查看所用的WSL版本: wsl -l -v
在这里插入图片描述

登录WSL

创建一个默认用户xx,设置密码:
在这里插入图片描述

可以查看所用的Linux版本: lsb_release -a
在这里插入图片描述
更新软件包:sudo apt update && sudo apt upgrade

Ubuntu 24.04 迁移到 D 盘

首先我们查看一下虚拟机状态,输入下列命令:
wsl -l -v执行 wsl --shutdown 命令使其停止运行,再次执行 wsl -l -v 确认停用。先手动创建迁移的目标文件夹,然后通过命令导出原虚拟机的备份:
wsl --export Ubuntu-24.04 D:\WSL2\Ubuntu\Ubuntu.tar注销原 wsl 虚拟机:
wsl --unregister Ubuntu-24.04将备份导入到新的目标文件夹中:
wsl --import Ubuntu-24.04 D:\WSL2 D:WSL2\Ubuntu\Ubuntu.tar开启WSL2

二、安装uv

官方教程:https://uv.doczh.com/getting-started/installation/ 按照教程中的curl -LsSf https://astral.sh/uv/install.sh | sh下载很慢。我们可以直接访问https://astral.sh/uv/install.sh 把文件下载下来,然后切换到sh文件目录,执行:chmod +x uv-installer.sh并安装./uv-installer.sh

一般这一步也会卡。。。
在这里插入图片描述
直接访问uv官网https://github.com/astral-sh/uv/releases下载文件,然后手动安装:
在这里插入图片描述
如果你安装成功了,执行source $HOME/.local/bin/env 即可:
在这里插入图片描述

三、创建虚拟环境并安装vLLM

vLLM的安装可参考官网文档:https://docs.vllm.com.cn/en/latest/getting_started/installation/gpu.html
这里我们使用uv安装。

uv venv --python 3.12
source .venv/bin/activate
uv pip install "vllm>=0.8.5" modelscope -i https://pypi.tuna.tsinghua.edu.cn/simple
# 有可能需要: uv pip install flashinfer-python==0.2.10 -i https://pypi.tuna.tsinghua.edu.cn/simple

四、测试Qwen2.5-VL模型的效果

1. 下载Qwen2.5-VL模型

激活vllm虚拟环境,下载模型:

modelscope download --model Qwen/Qwen2.5-VL-32B-Instruct-AWQ --local_dir /mnt/d/scripts/myvllm2/model/Qwen2.5-VL-32B-Instruct-AWQ

Qwen2.5-VL-7B-Instruct支持最长32768个token的上下文长度。使用双卡运行模型:

export TORCH_CUDA_ARCH_LIST="8.9"
export CUDA_VISIBLE_DEVICES=3,4
vllm serve model/Qwen2.5-VL-7B-Instruct \--tensor-parallel-size 2 \--max-model-len 32768 \--dtype auto \--gpu-memory-utilization 0.90 \--port 8089 \--host 0.0.0.0 \--enable-auto-tool-choice \--tool-call-parser hermes \--enable-chunked-prefill \--enable-prefix-caching

实测效果如下:
在这里插入图片描述
测试代码如下:

from openai import OpenAI
import base64# 初始化客户端,指向你的vLLM服务器
client = OpenAI(api_key="EMPTY",  # vLLM默认不需要API keybase_url="http://localhost:8089/v1"  # 替换为你的服务器IP和端口
)# 函数:读取图片并转换为base64编码
def image_to_base64(image_path):with open(image_path, "rb") as image_file:return base64.b64encode(image_file.read()).decode('utf-8')# 指定本地图片路径
image_path = "img/image.png"  # 请替换为你实际的图片路径# 构建请求消息
messages = [{"role": "user","content": [{"type": "text", "text": "请描述这张图片的内容。"},  # 你的文本指令{"type": "image_url","image_url": {# 指向本地图片文件"url": f"data:image/png;base64,{image_to_base64(image_path)}"}}]}
]# 发送请求
response = client.chat.completions.create(model="model/Qwen2.5-VL-7B-Instruct",  # 模型名称,需与启动时一致messages=messages,max_tokens=1024  # 控制模型生成的最大token数
)# 打印模型回复
print(response.choices[0].message.content)

2. 注

笔者最开始下载的是 Qwen/Qwen2.5-VL-32B-Instruct-AWQ,2025年9月12日在vllm=0.10.1版本上,输入图片会返回乱码。
在这里插入图片描述

http://www.dtcms.com/a/529807.html

相关文章:

  • 如何在Linux(Ubuntu)操作系统上查看文件的MD5,SHA256等校验码
  • 网站付的保证金怎么做会计凭证山东公司网站建设
  • 商城网站建设企业lamp 搭建wordpress
  • 做网站对企业有什么好处2022年网站能用的
  • 邯郸推广网站建设哪个好桐乡市城乡规划建设局网站
  • 布吉网站的建设中国菲律宾最新局势
  • 青海电商网站建设公司中国十大最著名品牌
  • ML 与 DL 常用数据集介绍
  • 佛山网站建设公司怎么样石家庄网站建设远策科技
  • 厦门u 网站建设如何选择昆明网站建设
  • 做网站生意多吗a5站长平台
  • 网站开发企业一级a做爰片免费网站孕交视频
  • 旅游网站设计规划书做视频网站视频用什么插件吗
  • 继承Thread类
  • 福建城建设厅官方网站昆山高端网站设计公司
  • 呼市网站seo优化工资提成怎么算邙山郑州网站建设
  • 【C++】开发环境配置
  • 百度下载软件太慢了怎么办
  • 【Windows】关于搜狗浏览器安装11、12版本-区别
  • 深圳响应式设计企业网站网站建设 部署与发布视频教程
  • pyttsx3使用Windows 10的Kangkang语音
  • 3.权限(一)
  • Gurobi vs CPLEX:大规模优化求解器的选择逻辑与国产替代新选项
  • 优秀的手机网站案例走着瞧网站 设计
  • 济南网站建设外包公司福田欧曼行星
  • 建设网站的基础知识企业宣传片制作软件app
  • 【07】C语言中的浮点类型详解
  • 营销型网站代理网站上面的水印怎么做
  • 西安网站建设推荐q479185700上墙wordpress 已登录用户登录
  • 创新的南昌网站设计yandx引擎入口