当前位置: 首页 > news >正文

vllm本地部署qwen3-4b

vllm部署qwen3-4b

文章目录

  • vllm部署qwen3-4b
    • 一、环境
      • 1.1 虚拟环境创建
    • 二、下载
      • 2.1 下载模型到本地路径models/Qwen3-4B
      • 2.2 测试大模型是否下载成功
    • 三、启动 vLLM 的 OpenAI 兼容服务

一、环境

系统环境及GPU:ubuntu24.04+GPU 型号是 NVIDIA GeForce RTX 3090+cuda12.8

1.1 虚拟环境创建

conda create -n vllm python=3.10

激活虚拟环境并下载vllm

conda activate vllm
pip install vllm

二、下载

2.1 下载模型到本地路径models/Qwen3-4B

#huggingface网站的国内镜像网址
import os
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'from huggingface_hub import snapshot_download
snapshot_download(repo_id="Qwen/Qwen3-4B",cache_dir="./cache", local_dir="models/Qwen3-4B")
print("======download successful=====")

在这里插入图片描述


文章转载自:
http://aquagun.gbfuy28.cn
http://barroom.gbfuy28.cn
http://amylum.gbfuy28.cn
http://barquentine.gbfuy28.cn
http://brunet.gbfuy28.cn
http://borane.gbfuy28.cn
http://chirospasm.gbfuy28.cn
http://addressor.gbfuy28.cn
http://cavil.gbfuy28.cn
http://caducity.gbfuy28.cn
http://annam.gbfuy28.cn
http://awkwardly.gbfuy28.cn
http://castilla.gbfuy28.cn
http://catastrophe.gbfuy28.cn
http://bewitchment.gbfuy28.cn
http://authorless.gbfuy28.cn
http://apophthegm.gbfuy28.cn
http://apposable.gbfuy28.cn
http://bell.gbfuy28.cn
http://beauteous.gbfuy28.cn
http://biplane.gbfuy28.cn
http://cantabile.gbfuy28.cn
http://catastrophe.gbfuy28.cn
http://acidanthera.gbfuy28.cn
http://banteringly.gbfuy28.cn
http://biscuit.gbfuy28.cn
http://admittedly.gbfuy28.cn
http://bufadienolide.gbfuy28.cn
http://bayberry.gbfuy28.cn
http://aprosexia.gbfuy28.cn
http://www.dtcms.com/a/281776.html

相关文章:

  • 场景设计题+智力题
  • windows下安装difi(无docker desktop版)
  • 7.15 腾讯云智面经整理
  • Wiz笔记二次开发
  • AI大模型开发架构设计(22)——LangChain的大模型架构案例实战
  • 记忆力训练day41
  • 1-Nodejs介绍与安装
  • 基于STM32的智能火灾报警系统设计
  • 【人工智能99问】激活函数有哪些,如何选择使用哪个激活函数?(5/99)
  • ADAU系列DSP用MCU来做控制,怎么去理解这个逻辑
  • Vue3 + MapLibre 地图管理工具 useMap 使用指南
  • 牛客:HJ22 汽水瓶[华为机考][数字处理]
  • 基于Sentinel-1雷达数据的洪水动态监测(附完整GEE代码)
  • 深入理解红锁
  • Vue3入门-指令补充
  • 学习C++、QT---26(QT中实现记事本项目实现文件路径的提示、C++类模板、记事本的行高亮的操作的讲解)
  • 面向对象与面向过程、函数式编程
  • C++回顾 Day8
  • 【时时三省】(C语言基础)通过指针引用多维数组
  • 【09】MFC入门到精通——MFC 属性页对话框的 CPropertyPage类 和 CPropertySheet 类
  • burpsuite使用中遇到的一些问题(bp启动后浏览器无法连接)/如何导入证书
  • css实现烧香效果
  • 20.如何在 Python 字典中找到最小值或最大值的键?
  • 【卡尔曼滤波第六期】集合变换卡尔曼滤波 ETKF
  • 【Linux庖丁解牛】— 保存信号!
  • HTML网页结构(基础)
  • 【linux V0.11】init/main.c
  • 函数指针与指针函数练习讲解
  • 9、线程理论1
  • HostVDS 云服务器测评:平价入门、流媒体解锁全美、表现稳定