当前位置: 首页 > news >正文

AWQ量化

基础原理

环境配置

1、pip install autoawq

这里有个问题是目前最新版本不用autoawq, 后续代码使用的是awq

2、下载一个实验小模型,目前awq支持的模型不多,基本就是几个经典的模型,所以这依然
用nano-vllm里面的Qwen3-0.6B这个模型做实验

3、实际测试会遇到AttributeError: ‘Catcher’ object has no attribute ‘attention_type’, 可以把
transformers的版本回退到 transformers==4.51.3,此外还有多卡gpu机器好像有点问题,这
里我是直接export CUDA_VISIBLE_DEVICES=0设置为单卡就可以了,其他显存问题oom可
以参考这里

代码demo

from awq import AutoAWQForCausalLM
from transformers import AutoTokenizer# 模型路径(Hugging Face Hub 或本地路径)
model_path = "huggingface/Qwen3-0.6B"  # 或 "Qwen/Qwen-7B-Chat" 等
quant_path = "./qwen-awq"  # 保存路径# 加载 tokenizer
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)# 加载模型(仅 CPU 加载,节省显存)
model = AutoAWQForCausalLM.from_pretrained(model_path, trust_remote_code=True)
print(model)# 量化配置
quant_config = {"zero_point": True,    # 是否使用零点(推荐 True)"q_group_size": 128,   # 分组大小(128 是标准)"w_bit": 4,            # 权重比特数"version": "GEMM"      # 使用 GEMM 内核(高效)
}# 执行量化(需要 GPU!)
model.quantize(tokenizer,quant_config=quant_config,# 可选:指定校准数据集(默认使用 pile-val-backup的前 128 个样本)# calib_data="c4",  # 或 "pile", "wikitext2"n_parallel_calib_samples=1,max_calib_seq_len=1024, # 从数据集中取出的每句话,转为token的时候最大长度不能超过1024max_calib_samples=128 # 从数据集中取出128句话,可以理解为batch_size=128
)# 保存量化模型
model.save_quantized(quant_path)
tokenizer.save_pretrained(quant_path)
http://www.dtcms.com/a/517351.html

相关文章:

  • 四川禾力建设工程质量检测有限公司网站宣传片拍摄制作多少钱
  • 自动化文件管理:分类、重命名和备份
  • 长沙网站seo推广东莞网站制作建设公司
  • 大型网站建设哪个好网络营销专业背景
  • 如何在Elasticsearch中设置召回率优先的搜索策略?
  • 泉州网站建设工作室涿州住房和城乡建设局网站
  • 上海网站专业制作怎么在百度上推广自己
  • a站插画ss网站代码
  • 操作系统-内存寻址
  • 面试Spring全家桶(一)
  • 快速上手TypeScript,TS速通
  • 建设电影网站视频素材资源管理器
  • 数据结构——拓扑排序(2)
  • 天津大邱庄网站建设公司fontawesome 网站
  • 【前端】变量命名与管理的关键实践
  • 网站自动推广软件免费做平面什么网站的素材不侵权
  • PostgreSQL数据库关于pg_rewind的认识
  • 有网站代码怎么建站2021关键词搜索排行
  • 12类Linux常用命令
  • 云数据库:从传统自建到云端服务的技术进化之路
  • 做花语的网站河南建设厅网站
  • 学校资源网站建设方案给缅甸公司网站做维护工作时间段
  • iis发布网站慢腾云建站官网
  • 电脑做会计从业题目用什么网站咸阳做网站
  • 凡科网站建设完成下载下载器淘宝网站可以做百度快照吗
  • 做更好的自己 网站wordpress网站搭建教程
  • KDD 2025 | CMA:用于时序去噪和预测的统一情境元自适应方法!
  • 湖北企业网站建设网页制作购物网站
  • 建设网站制作流程做网站需要什么学历
  • 大数据存储治理三剑客 -- 冷备、压缩、生命周期