当前位置: 首页 > wzjs >正文

wordpress网站关闭常州住房和城乡建设局网站

wordpress网站关闭,常州住房和城乡建设局网站,网站主机价格,太原公司网站建设单卡4090部署Qwen3-32B-AWQ(4bit量化) 模型:Qwen3-32B-AWQ(4bit量化) 显卡:4090 1 张 python版本 python 3.12 推理框架“vllm 重要包的版本 vllm0.9.0创建GPU云主机 这里我使用的是优云智算平台的GPU,使用链接可以看下面的 https://blog.…

单卡4090部署Qwen3-32B-AWQ(4bit量化)

  • 模型:Qwen3-32B-AWQ(4bit量化)

  • 显卡:4090 1 张

  • python版本

    python 3.12

  • 推理框架“vllm

  • 重要包的版本

    vllm==0.9.0
    

创建GPU云主机

  • 这里我使用的是优云智算平台的GPU,使用链接可以看下面的

    https://blog.csdn.net/hbkybkzw/article/details/148310288

  • 注册链接如下

    https://passport.compshare.cn/register?referral_code=tRej61o0bLFAfC9mS6Php

创建

  • 这一步非必须,如果有自己的GPU机器则可以直接跳过

    我们进入部署GPU实例 选择平台镜像,具体操作如下

    image-20250530142747148

    在更多配置中设置实例名称,付款方式使用按量计费,点击立即部署

    image-20250530142819601

    等待状态变为运行中,复制登录指令和密码进行登录,这里我们使用finalshell进行连接

    image-20250530143052240

    下载模型以及安装python环境会花费一部分时间,这部分时间我们可以先将实例关闭后选择无卡模式启动,这样就节省费用了

image-20250530143511717


开放端口(非必须)

  • 配置防火墙

    image-20250530161525079

    添加规则,这里我开放了8081端口

    image-20250530161642556


安装C编译器(必须)

  • 当前使用的这个镜像是没有c编译器的,需要安装一下

    apt-get update
    apt-get install build-essential
    
  • 设置环境变量

    export CC=/usr/bin/gcc
    
  • 检查C编译器是否正确安装

    gcc --version
    

    image-20250530153952221


安装

模型下载

  • Qwen3-32B-AWQ模型的modelscope和huggingface地址如下

    modelscope: https://modelscope.cn/models/Qwen/Qwen3-32B-AWQ

    huggingface: https://huggingface.co/Qwen/Qwen3-32B-AWQ

    这里我们以modelscope为例,复制模型名称 Qwen/Qwen3-30B-A3B, 这个名称在我们下载的时候会用到

    image-20250530144257611

  • 使用modelscope下载,需要安装modelscope库

    pip install modelscope
    

    已经有modelscope库的需要升级下面的几个包

    pip install --upgrade modelscope -i https://pypi.tuna.tsinghua.edu.cn/simplepip install --upgrade transformers -i https://pypi.tuna.tsinghua.edu.cn/simple
    pip install --upgrade peft -i https://pypi.tuna.tsinghua.edu.cn/simple
    pip install --upgrade diffusers -i https://pypi.tuna.tsinghua.edu.cn/simple
    
  • 下载

    默认下载在当前用户的.cache文件夹下,比如现在是root用户,则默认在

    /root/.cache/modelscope/hub/models/Qwen/Qwen3-32B-AWQ

    我们希望将其下载在

    /root/Qwen/Qwen/Qwen3-32B-AWQ

    from modelscope.hub.snapshot_download import snapshot_downloadmodel_name = "Qwen/Qwen3-32B-AWQ"cache_dir = "/root"  # 替换为你希望的路径snapshot_download(model_name, cache_dir=cache_dir)
    

    image-20250530145900920

  • 在下载完成后,我们查看下

    ls -lha /root/Qwen/Qwen3-32B-AWQ
    

    image-20250530150024516


环境安装

  • 使用conda创建虚拟环境

    conda create --name qwen3-awq python=3.12conda activate qwen3-awq
    
  • 下载vllm(指定清华源,否则极慢)

    pip install "vllm>=0.8.5" -i https://pypi.tuna.tsinghua.edu.cn/simple
    
  • 需要注意的是transformers的版本需要>=4.51.0

    pip show transformers
    

    image-20250530152657472


vllm启动

  • llm启动命令

    vllm serve /root/Qwen/Qwen3-32B-AWQ \--max-model-len 8192 \--enable-reasoning --reasoning-parser deepseek_r1 \--gpu-memory-utilization 0.95 \--host 0.0.0.0 \--port 8081 \--served-model-name Qwen3-32B-AWQ-vllm
    

    以下是对VLLM启动命令参数的简要说明

    参数简要说明
    vllm serve /root/Qwen/Qwen3-32B-AWQ启动VLLM服务、指定模型路径
    --enable-reasoning启用推理功能(think)
    --reasoning-parser指定推理解析器
    --max-model-len模型处理的最大序列长度
    --gpu-memory-utilization预分配的GPU内存比例 (vllm默认为0.9)
    --host设置服务监听的主机地址,0.0.0.0表示监听所有网络接口
    --port设置服务监听的端口号
    --served-model-name设置模型名
  • 以8081端口启动成功

    image-20250530162100565

  • 显存占用情况

    image-20250530162148847

  • 测试

    测试代码

    from openai import OpenAI
    import openaiopenai.api_key = '1111111' # 这里随便填一个
    openai.base_url = 'http://127.0.0.1:8081/v1'def get_completion(prompt, model="QwQ-32B"):client = OpenAI(api_key=openai.api_key,base_url=openai.base_url)messages = [{"role": "user", "content": prompt}]response = client.chat.completions.create(model=model,messages=messages,stream=False)reasoning_content = response.choices[0].message.reasoning_contentcontent = response.choices[0].message.contentreturn reasoning_content,contentprompt = '请计算straberry这个单词中字母r的出现次数'reasoning_content,content = get_completion(prompt, model="Qwen3-32B-AWQ-vllm")
    print('reasoning_content',reasoning_content)
    print('content',content)
    

    image-20250530175141999

    看看每秒tokens数

    image-20250530175215188



文章转载自:

http://RDph1vLv.wpspf.cn
http://o56Yrp7Y.wpspf.cn
http://xOC95Zel.wpspf.cn
http://dCPu7GQl.wpspf.cn
http://yNcX4iaO.wpspf.cn
http://LkVkHdBr.wpspf.cn
http://ErRJAZO5.wpspf.cn
http://PLrbBjkV.wpspf.cn
http://vHXji1av.wpspf.cn
http://GnYk4Haf.wpspf.cn
http://if1YZvqX.wpspf.cn
http://jPWBY24n.wpspf.cn
http://KIinhwvU.wpspf.cn
http://tLquYObp.wpspf.cn
http://Kgac5iPw.wpspf.cn
http://7y2rdBL6.wpspf.cn
http://fNyeYbrL.wpspf.cn
http://kykgLwHI.wpspf.cn
http://CL1zGIdf.wpspf.cn
http://PWsRners.wpspf.cn
http://MAU8Lwkc.wpspf.cn
http://rJxJNZmh.wpspf.cn
http://BvWufyad.wpspf.cn
http://SnNg0gwx.wpspf.cn
http://O7cPLnA2.wpspf.cn
http://bMHVVSlf.wpspf.cn
http://wLUGvcWo.wpspf.cn
http://SPl0CHZ5.wpspf.cn
http://3uKStWd8.wpspf.cn
http://PDZDwkkp.wpspf.cn
http://www.dtcms.com/wzjs/645648.html

相关文章:

  • 建站用什么平台好红豆网梧州论坛
  • 西安网站建设哪家强wordpress标题图片
  • 企业建一个网站需要多少钱wordpress 验证表单
  • 漯河网站建设哪家网站上动态图片怎么做
  • 做的好点的外贸网站吉林省吉林市丰满区
  • 高速建设材料在哪个网站购买成都网络推广运营
  • 网站栏目描述网站页面链接怎么做
  • 常州网站制作方案《网站推广策划》
  • 做寝室介绍网站外贸企业网站建设一条龙
  • 中山市智能h5网站建设公司freenom申请域名
  • 服装箱包网站建设品牌策划公司名字大全
  • 网站建设开发哪家好宝安中心网站建设
  • 免费做的网站怎么设置域名怎么给网站加外链
  • 芜湖网站开发阿里云做网站电话
  • 网站正在升级建设中广东建设工程执业资格注册中心网站
  • 长沙品质企业建站服务电话仿站网
  • 三亚市建设局网站帮人家做网站
  • 如果建设一个网站seo排名关键词
  • 网站技术可行性天津百度百科
  • 学网站开发月薪多少钱内部网
  • 上海做网站推广公司苏州网站制作聚尚网络
  • 网站建设鸿儒集团网站品牌建设特点
  • 基于php网站建设论文什么浏览器适合看网站
  • 网站做跳转wxparse wordpress
  • 合肥微网站电子商务网站建设与维护 论文
  • 做公司网站哪家好360帝国模板网欢迎大家来访_济南网站建设推广_济南 去114网
  • 福建优化seowordpress换模板 seo
  • 网站建设请款报告wordpress导航模板
  • 专业网站定制平台广西建设监理协会官方网站
  • 嘉兴网站建设技术托管东莞市智通人才市场最新招聘信息