当前位置: 首页 > news >正文

如何本地部署Qwen3系列的大小模型235B/32B并进行推理服务及并发测试?

环境:

Ubuntu20.04

Qwen3-30B-A3B-AWQ

Qwen3-32B-Int4-W4A16

Qwen3-32B-FP8

Qwen3-235B-A22B-AWQ

H20 95Gx2

vllm 0.8.5

问题描述:

如何本地部署Qwen3系列的大小模型235B/32B并进行推理服务及并发测试?

在这里插入图片描述

解决方案:

1.按需新建模型相关文件夹

mkdir Qwen3
chmod 777 /mnt/program/Qwen3

2.配置conda源

nano ~/.condarc

nano /root/miniconda/.condarc

channels:- http

相关文章:

  • C#自定义扩展方法 及 EventHandler<TEventArgs> 委托
  • 【linux驱动】【设备树】按键设备树讲解
  • WaterStamp —— 一个实用的网页水印生成器开发记
  • 【周输入】510周阅读推荐-3
  • c/c++数据类型转换.
  • 二:操作系统之进程控制块(PCB)
  • Selinux权限问题处理指导文档分享
  • 菱形继承原理
  • 中国与全球电子取证行业市场报告(公开信息版)
  • 暴雨大讲堂:高性能计算面临的芯片挑战
  • 牛客网NC210769: 字母大小写转换问题解析
  • HJ5 进制转换【牛客网】
  • Python 中二维列表(list)(嵌套列表)详解
  • uWSGI是什么?
  • Java中关于方法的调用和递归
  • 【cursor】有效解决
  • Appium自动化测试环境搭建及配置
  • 西门子1200/1500博图(TIA Portal)寻址方式详解
  • AI 制作游戏美术素材流程分享(程序员方向粗糙版)
  • CCpro工程编程软件
  • 网络直播间销售玩具盲盒被指侵权,法院以侵犯著作权罪追责
  • 外媒:哈马斯一名高级指挥官尸体被发现,系辛瓦尔弟弟
  • 义乌至迪拜“铁海快线+中东快航”首发,物流成本降低18%
  • 有关“普泽会”,俄官方表示:有可能
  • 美国贸易政策|特朗普模式:你想做交易吗?
  • 武康大楼再开发:一栋楼火还不够,要带火街区“朋友圈”