当前位置: 首页 > news >正文

品牌的佛山网站建设价格北京网页设计工资

品牌的佛山网站建设价格,北京网页设计工资,什么是seo,做视频怎么做文章目录 写在前面1. 环境配置2. 下载QwQ-32b 8bit量化模型3. 使用vLLM本地推理 写在前面 仅作个人学习记录用。本文记录QwQ-32b 8bit量化模型的部署的详细方法。 1. 环境配置 以下环境经测试无bug(Deepseek R1用这个环境也能直接跑): gp…

文章目录

  • 写在前面
  • 1. 环境配置
  • 2. 下载QwQ-32b 8bit量化模型
  • 3. 使用vLLM本地推理

写在前面

仅作个人学习记录用。本文记录QwQ-32b 8bit量化模型的部署的详细方法。

1. 环境配置

以下环境经测试无bug(Deepseek R1用这个环境也能直接跑):

gpu: V100(32GB) * 2
python 3.12
cuda 12.1
pytorch==2.5.1
modelscope==1.22.3
tqdm==4.67.1
transformers==4.48.2
vllm==0.7.1

注意,如果安装vllm时发生报错:

.......
Failed to build xformers
ERROR: Failed to build installable wheels for some pyproject.toml based projects (xformers)

这是由于xformers与pytorch版本不符导致的,如果使用本文环境,对应的xformers版本为v0.0.28.post3.。尽量通过下载whl文件(链接)的方式来安装xformers。

2. 下载QwQ-32b 8bit量化模型

不少人(包括我)在QwQ-32B模型的使用过程中遇到了无限生成、重复内容过多的问题。也有人反馈deepseek-r1-distill-qwen-32b和Qwen2.5-Max推理模式也会出现类似问题。

为避免这些问题,可以考虑部署Unsloth 团队修复了上述错误的模型。
在这里插入图片描述

从 ModelScope 下载模型

如果从你从 HuggingFace 下载比较慢,也可以从ModelScope【链接】中下载。

从ModelScope下载8bit量化的gguf文件可以通过命令行,代码如下:

modelscope download --model unsloth/QwQ-32B-GGUF QwQ-32B.Q8_0.gguf --local_dir ./dir

vLLM支持gguf 格式,但是在运行时仍然需要指定tokenizer,因此除了下载模型权重之外,还需要下载QwQ-32B的Tokenizer。tokenizer相关文件如下:

config.json
tokenizer_config.json
tokenizer.json

自行下载:https://huggingface.co/Qwen/QwQ-32B/tree/main

全部下载完成后,将MODEL_PATH统一改成你下载的模型所在的文件夹位置。

3. 使用vLLM本地推理

ChatGLM3-6b部署完毕,接下来可以运行Demo来验证是否部署成功。
本地调用代码如下:

from vllm import LLM, SamplingParamsif __name__ == '__main__':MODEL_PATH = "XXXX/QwQ-32B-unsloth/QwQ-32B.Q8_0.gguf"llm = LLM(model=MODEL_PATH,tokenizer= "XXXX/QwQ-32B-unsloth",tensor_parallel_size=4,  # 多GPU并行数(单GPU设为1)trust_remote_code=True,  # 允许自定义代码gpu_memory_utilization=0.7,  # GPU显存利用率dtype="float16",  # 量化精度(可选:float16/auto)max_model_len=10240)# 配置生成参数sampling_params = SamplingParams(temperature=0.6,top_p=0.9,repetition_penalty=1.1,max_tokens=2048)messages = ['xxxx']outputs = llm.generate(messages, sampling_params)# 输出结果for output in outputs:print(f"Response: {output.outputs[0].text}\n")

正常运行:
在这里插入图片描述

(其实还是会复读)

http://www.dtcms.com/a/501917.html

相关文章:

  • 校园兼职网站建设虚拟机做的网站怎么让外网访问不了网
  • 网站开发人员分配深圳企业建站模板
  • 仿百度文库网站源码商业版dedecms(梦织)系统内核如何引流被动加好友
  • 做设计的公司的网站长沙做网站一般多少钱合适
  • 怎么做网站内部搜索功能seo技术外包公司
  • 滕州网站开发青岛的seo服务公司
  • 做仿牌网站空间自己电脑做电影网站吗
  • 曲周手机网站建设阿里云轻应用服务器 建设网站
  • 明星网站设计论文代备案网站
  • 天津网站建设揭秘杭州搜索引擎排名
  • 潞城市网站建设公司中国自助主做网站有哪些
  • 深圳营销型网站开发摄影网站需求分析
  • 深圳手机端网站建设专业百度商业平台官网
  • 猪八戒网怎么做网站石家庄语音网站建设公司
  • 网站禁止被采集网站服务器有哪几种
  • 网站上面的logo怎么做潍坊市建设工程质量安全监督站网站
  • 建设网站专栏外管局网站上做存量权益登记
  • 天津房地产网站建设网站建设服务ysaigo
  • 河北住房城乡建设厅官方网站无锡建设工程服务中心
  • PHP网站开发如何建立vip公共资源交易中心是事业单位吗
  • 网站建设 问卷调查免费培训机构
  • 做效果图去哪个网站接活有支付功能网站用的编程语言
  • 管理系统和网站哪个好做怎么在wordpress中添加类似赶集网的地图
  • 专业网站建设公司首选佛山市做网站
  • 制作自己的平台网站wordpress 移动端不显示
  • 唐山建设网站建站仿西部数码网站
  • 做视频图片博客网站查看网站点击量
  • 木藕设计网站大全html爱心代码
  • 新乡网站搜索引擎优化禅城网站建设企业
  • 福州网上商城网站建设企业建设网站的空间有哪些