当前位置: 首页 > wzjs >正文

汝州市住房和城乡规划建设局网站可以做网站的软件上传歌曲

汝州市住房和城乡规划建设局网站,可以做网站的软件上传歌曲,宣城市建设监督管理局网站,河间市网站建设公司模型量化‌是将神经网络中的浮点计算(如32位/16位)转换为低比特定点计算(如8位整型)的技术,通过减少数值精度来压缩模型体积并加速计算。其本质是一种针对模型参数的‌有损信息压缩‌,在保证模型性能的前提…

模型量化‌是将神经网络中的浮点计算(如32位/16位)转换为低比特定点计算(如8位整型)的技术,通过减少数值精度来压缩模型体积并加速计算。其本质是一种针对模型参数的‌有损信息压缩‌,在保证模型性能的前提下优化部署效率。

一、模型量化‌的目标

  • 压缩模型体积‌
    将浮点权重转换为低位宽整数存储,模型体积可减少至原大小的1/4。
  • 加速推理计算‌
    硬件对低位宽计算(如INT8)的支持效率通常比FP32快2-4倍

二、transfomers 进行模型量化‌与保存

  • 前提环境
pip install --upgrade transformers accelerate bitsandbytes
1、4bit
  • 4 位量化模型可将内存使用量减少 4 倍,对于大型模型,设置“device_map=“auto””可有效地在所有可用 GPU 上分配权重。
from transformers import AutoModelForCausalLM, BitsAndBytesConfig#配置量化参数
quantization_config = BitsAndBytesConfig(load_in_4bit=True)model_4bit = AutoModelForCausalLM.from_pretrained("bigscience/bloom-1b7",device_map="auto",quantization_config=quantization_config
)
2、8bit
  • 8 位量化模型可将内存使用量减半,对于大型模型,设置“device_map=“auto””以有效地将权重分配到所有可用的 GPU 上。
from transformers import AutoModelForCausalLM, BitsAndBytesConfigquantization_config = BitsAndBytesConfig(load_in_8bit=True)model_8bit = AutoModelForCausalLM.from_pretrained("bigscience/bloom-1b7", device_map="auto",quantization_config=quantization_config
)
3、量化模型保存与加载
  • 保存
# 保存量化模型
model.save_pretrained("./quant_llama2")
tokenizer.save_pretrained("./quant_llama2")
  • 加载
from transformers import AutoModelForCausalLM, AutoTokenizermodel = AutoModelForCausalLM.from_pretrained("本地模型路径", device_map="auto")
4、模型反(去除)量化
  • 量化后,您可以通过反量化(dequantize())将模型恢复到原始精度,但这可能会导致一些质量损失。请确保您拥有足够的 GPU 内存来容纳反量化后的模型。
from transformers import AutoModelForCausalLM, BitsAndBytesConfig, AutoTokenizermodel = AutoModelForCausalLM.from_pretrained("facebook/opt-125m", BitsAndBytesConfig(load_in_4bit=True))
model.dequantize()

三、torch 进行模型量化‌与保存

import torch.quantization# 动态量化示例
model = torch.nn.Linear(100, 50)
quantized_model = torch.quantization.quantize_dynamic(model,{torch.nn.Linear},  # 指定量化层dtype=torch.qint8
)# 保存量化模型
torch.save(quantized_model.state_dict(), "dynamic_quant.pth")[1,14](@ref)
http://www.dtcms.com/wzjs/596571.html

相关文章:

  • 网站优化要用什么软件济宁十大外贸公司
  • 官方网站开发合同软件开发软件开发网站
  • 在临沂做网站男女直接做视频网站
  • 宝坻区建设路小学网站网站动画是怎么做的
  • 网站项目进度网页设计制作报价表
  • 阿里做外贸是哪个网站苏州网站排名推广
  • 装饰公司315活动网站怎么做防城港北京网站建设
  • python做网站方便吗安阳网站设计哪家专业
  • 网站域名注册如何填写手机排行网站有哪些
  • 济南做网站建网站公司定制柜需要多少钱
  • 帮人网站开发维护违法网站什么做
  • 淘宝客网站设计企业网站管理系统项目文档
  • 网站建设大客户沟通技巧怎么用ps做网站首页字
  • 群晖做自己的电影网站东莞本地的发布平台
  • 网站开发 职业环境分析本地装修公司怎么找
  • 网站开发与运营方向和企业管理方向莱芜半岛
  • 建设银行网站会员基本信息帮忙找人做网站
  • 织梦后台发布了网站没显示校园网站建设网
  • 郑州做网站 哪家好深圳传媒公司
  • 专业手机网站制作公司wordpress自学教程
  • 廊坊做网站做淘宝客建网站用什么
  • 创建网站平台哔哩哔哩适合夫妻看的电视剧
  • 医疗网站专题模板陕西省建设银行分行网站
  • 同服务器网站查询工具用python做网站开发的课程
  • 网站文章优化事项网站广告看不到
  • 国内产品网站w源码1688如何管理企业网站
  • wordpress建站产品导入不同目录app网站建设阿里巴巴
  • 网站开发的意义徐州通域网架公司
  • 广州黄埔区开发区建设局网站荣成市住房和城乡建设局网站
  • 湖南网站seo地址做网站知识点