当前位置：首页 > news >正文

如何本地部署Qwen3系列的大小模型235B/32B并进行推理服务及并发测试？

news 2025/10/28 13:55:07

环境：

Ubuntu20.04

Qwen3-30B-A3B-AWQ

Qwen3-32B-Int4-W4A16

Qwen3-32B-FP8

Qwen3-235B-A22B-AWQ

H20 95Gx2

vllm 0.8.5

问题描述：

如何本地部署Qwen3系列的大小模型235B/32B并进行推理服务及并发测试？

在这里插入图片描述

解决方案：

1.按需新建模型相关文件夹

mkdir Qwen3
chmod 777 /mnt/program/Qwen3

2.配置conda源

nano ~/.condarc

nano /root/miniconda/.condarc

channels:- http

http://www.dtcms.com/a/198976.html

相关文章：

C#自定义扩展方法及 EventHandler＜TEventArgs＞委托

【linux驱动】【设备树】按键设备树讲解

WaterStamp —— 一个实用的网页水印生成器开发记

【周输入】510周阅读推荐-3

c/c++数据类型转换.

二：操作系统之进程控制块（PCB）

Selinux权限问题处理指导文档分享

菱形继承原理

中国与全球电子取证行业市场报告（公开信息版）

暴雨大讲堂：高性能计算面临的芯片挑战

牛客网NC210769: 字母大小写转换问题解析

HJ5 进制转换【牛客网】

Python 中二维列表（list）（嵌套列表）详解

uWSGI是什么？

Java中关于方法的调用和递归

【cursor】有效解决

Appium自动化测试环境搭建及配置

西门子1200/1500博图（TIA Portal）寻址方式详解

AI 制作游戏美术素材流程分享(程序员方向粗糙版)

CCpro工程编程软件

Git从入门到精通

centos7.9扩展已有分区空间

[LevelDB]LevelDB版本管理的黑魔法-为什么能在不锁表的情况下管理数据？

bus hound抓取的数据包各字段含义解释

DAY26 函数定义与参数

2025年- H28-Lc136- 24.两两交换链表中的节点（链表）---java版

Java开发经验——阿里巴巴编码规范实践解析3

创建指定版本的vite项目

【Retinanet】训练自己的数据集

InfluxDB 3 Core + Java 11 + Spring Boot：打造高效物联网数据平台