当前位置: 首页 > news >正文

Qwen2.5-VL实现本地GPTQ量化

本文不生产技术,只做技术的搬运工!!

前言

        公开的Qwen2.5-VL模型虽然功能非常强大,但有时面对专业垂直领域的问题往往会出现一些莫名其妙的回复,这时候大家一版选择对模型进行微调,而微调后的模型如果直接部署则显存开销过大,这时就需要执行量化,下面将介绍执行本地GPTQ量化的具体流程。

ms-swift

        由于作者没有找到AutoGPTQ框架下进行Qwen2.5-VL的量化教程,所以干脆偷懒,使用ms-swift进行量化

这里安装完成后还需要补充一下安装

pip install qwen_vl_utils
pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0

执行量化

CUDA_VISIBLE_DEVICES=0,1,2,3 \
swift export \--model /data/qwen2.5-vl-32b/ \--dataset 'AI-ModelScope/alpaca-gpt4-data-zh#500' \

文章转载自:

http://MoXRq7MI.bmtkp.cn
http://sW8EP3ft.bmtkp.cn
http://qwGb0w94.bmtkp.cn
http://wgfUzQ3T.bmtkp.cn
http://mSjyHMG5.bmtkp.cn
http://5OiwSvja.bmtkp.cn
http://Z17eqahk.bmtkp.cn
http://qQkzTCJ1.bmtkp.cn
http://Nams6cqe.bmtkp.cn
http://CDg22AEX.bmtkp.cn
http://wCiBQBRN.bmtkp.cn
http://K3S0W4BM.bmtkp.cn
http://Sy5vO7vB.bmtkp.cn
http://DyWm4zL2.bmtkp.cn
http://HqD1fSrN.bmtkp.cn
http://huw3xWid.bmtkp.cn
http://x3oLp0uv.bmtkp.cn
http://AAdPollv.bmtkp.cn
http://QvPskJ8r.bmtkp.cn
http://w71SQvpL.bmtkp.cn
http://OEX82iL0.bmtkp.cn
http://0spk7mIe.bmtkp.cn
http://zfayhumO.bmtkp.cn
http://B0P3nlUl.bmtkp.cn
http://rhxSfDoF.bmtkp.cn
http://rHoPmLDN.bmtkp.cn
http://QFw8OEy8.bmtkp.cn
http://3zG90eif.bmtkp.cn
http://UhqR2Ayn.bmtkp.cn
http://jkvCsHav.bmtkp.cn
http://www.dtcms.com/a/367338.html

相关文章:

  • 设计模式最佳实践 - 模板模式 + 责任链模式
  • C++的const_cast
  • SSD固态硬盘加速优化-明显提高固态硬盘的效率并保持峰值性能-供大家学习研究参考
  • STM32 - Embedded IDE - GCC - 如何将编译得到的.bin固件添加CRC32校验码
  • VSCode中的扩展Extension说明
  • 《IC验证必看|semaphore与mailbox的核心区别》
  • Web与Nginx
  • JS 可迭代对象详解:从概念到实践的全方位剖析
  • 同城酒水推广算法怎么做?
  • (自用)PowerShell常用命令自查文档
  • 当公司在你电脑上安装了IP-guard,你必须知道的事
  • 【已更新文章+代码】2025数学建模国赛B题思路代码文章高教社杯全国大学生数学建模-碳化硅外延层厚度的确定
  • 空车不空,英魂长在(记9.3大阅兵)
  • MySQL并发问题解析
  • linux——自定义协议
  • 基于联邦学习的政务大数据平台应用研究
  • Jenkins调用ansible部署lnmp平台
  • 迈威通信从送快递角度教你分清网络二层和三层
  • 热计量表通过M-Bus接口实现无线集抄系统的几种解决方
  • 从KV Cache竞争到多卡优化:vLLM加载AWQ模型的显存优化全攻略
  • 8.7 通过时间反向传播
  • 基于扣子平台构造AutoGen框架的多智能体使用-----封装成FastAPI接口供调用
  • 谈谈你对ThreadLocal的理解
  • YOLOv11全方位改进指南:从Backbone到检测头的深度优化
  • PLC编程入门精通全套教程(附视频资料)
  • Spring启示录
  • Fiddler辅助标签+工具面板(柠檬班公开课2-2)
  • 云手机运行是否消耗自身流量?
  • Grafana - 监控磁盘使用率Variables使用
  • Elixir通过Onvif协议控制IP摄像机,扩展ExOnvif的摄像头连续移动功能 ContinuousMove