当前位置: 首页 > wzjs >正文

word如何做网站做电商网站一般多少钱

word如何做网站,做电商网站一般多少钱,和一个网站做接口,不知道是谁做的网站 输入学号A100 * 8 量化Meta-llama8B模型实验 简介 本实验旨在探索在 NVIDIA A100 8 GPU 环境下,对 Meta-LLaMA-8B 大语言模型进行权重量化的可行性、效率与性能影响。通过采用 llmcompressor 工具集成 GPTQ 算法,实现对所有线性层的权重量化(W4A16…

A100 * 8 量化Meta-llama8B模型实验

简介

本实验旨在探索在 NVIDIA A100 × 8 GPU 环境下,对 Meta-LLaMA-8B 大语言模型进行权重量化的可行性、效率与性能影响。通过采用 llmcompressor 工具集成 GPTQ 算法,实现对所有线性层的权重量化(W4A16 方案)。最终通过 lm-eval 工具在 GSM8K 任务上对压缩模型进行评估。

实验步骤(含遇到的问题,解决方案)

一:使用 transformers 加载模型和分词器:

  • 使用 device_map=“auto” 自动分配多卡显存。
  • torch_dtype=“auto” 让模型根据硬件选择 FP16 。
    在这里插入图片描述

二:构建校准数据集:

  • Modelscope 下载 UltraChat 200k 数据集(最好使用与你的部署数据紧密匹配的校准数据)
    在这里插入图片描述
    在使用datasets加载数据集时遇到了一个问题:
    在这里插入图片描述
    这个问题出现的原因是数据集的 dataset_info.json 文件中的 features 字段格式不正确——它试图构造 Value 类型,但缺少 dtype 字段。
    解决方法:
    删除数据集目录下的 dataset_infos.json 文件,让 datasets 自动推断特征。

三:运行量化

  • 通过 llmcompressor 中的 GPTQModifier,将模型线性层权重压缩为 INT4(W4A16 格式)
  • 使用 one-shot 方法进行静态量化
  • 排除 lm_head,避免因极端权重量化精度损失
    在这里插入图片描述

实验结果

  • 量化过程
    在这里插入图片描述
  • 在量化到第31个迭代时,出现了OOM错误:
    在这里插入图片描述
  • 使用nvidia-smi观察了一下,发现好几张卡有其他进程在使用:
    在这里插入图片描述

量化的是8B的模型,其实不需要太多卡,那么如何修改代码,来指定运行量化的代码呢?
解决方法:设置环境变量,只暴露闲置的卡:

os.environ["CUDA_VISIBLE_DEVICES"] = "4,5,6"

然后重新量化:
在这里插入图片描述

可以看到,这样就只在这三张卡上运行量化了。
在这里插入图片描述
发现卡4使用率较高,而另外两张卡使用率很低,什么原因呢?
百度一下原因大致是:使用device_map=“auto” 在量化时选择了更多计算密集的层放到这张卡上(卡4)。
如何解决:可以通过手动配置 device_map 或使用 数据并行 等方式来更好地平衡负载,使得 GPU 4、5、6 的使用率更加均匀。
运行了大概二十多分钟就量化完成了,具体时间没有记录(后悔)。
在这里插入图片描述

我们使用du -sh简单看一下量化前和量化后的模型文件总大小:
15G Meta-Llama-3-8B-Instruct/
5.4G disk0-W4A16-G128/

这里5.4G 是合理的 GPTQ 4bit 模型大小,虽然不是完美的四分之一,但相比原始模型已经大大减小(接近 1/3)
为什么不是四分之一,截取一下gpt的回答,有错误欢迎指正:
在这里插入图片描述

部署推理及模型评估

  • 通过 lm-eval 工具(lm_eval 是一个用于评估语言模型性能的 Python 库,使用pip install安装即可),对量化模型在 GSM8K 数据集(gsm8k是数学推理任务,可以用你的目标任务替换)上的 zero-shot/few-shot 表现进行评估;
  • 评估中使用 vllm 作为推理框架,使用 huggingface 也可以;
lm_eval --model vllm \--model_args pretrained="./Meta-Llama-3-8B-Instruct-W4A16-G128",add_bos_token=true \--tasks gsm8k \--num_fewshot 5 \--limit 250

执行评估报错,这里也是因为显存的问题:
在这里插入图片描述
设置环境变量,用空闲的卡进行评估:

export CUDA_VISIBLE_DEVICES=4

在这里插入图片描述
可以看到这里四号卡在进行评估了,评估结果:
在这里插入图片描述
然后使用相同的方法评估一下量化前我们的llama 8B模型的准确率:
在这里插入图片描述

可见量化模型在 gsm8k 上 5-shot 的 exact match 达到 74.8%准确率,而量化前的模型准确率只有73.2%,这是什么原因呢(手动狗头)

这听起来违反直觉,但其实在实际应用中,这种现象并不罕见,原因可能包括:

  • GPTQ 的误差感知机制实际提升了模型“对任务有用”部分的表示能力;
  • 校准数据集(ultrachat_200k)与目标任务分布更贴近,反而帮助模型对某些推理任务表现得更好;
  • 测试集样本较少(你用的是 --limit 250),有统计波动;
  • 推理时的实现细节(如 BOS token 添加、tokenizer 或输入截断策略)可能略有差异;
  • 原始模型输出过于“冗长或不精确”,而量化后的模型输出更简洁,有利于 strict match。

对于实际的原因,可能要进一步实验和验证,这里就不继续了,要下班了。


文章转载自:

http://um1zEkVd.yxnkr.cn
http://eoKUfSL7.yxnkr.cn
http://Bdq79qV6.yxnkr.cn
http://SaDqGjtc.yxnkr.cn
http://OJuSkZix.yxnkr.cn
http://yfEQe9Cc.yxnkr.cn
http://C9O0eCQ3.yxnkr.cn
http://6UFs3fMP.yxnkr.cn
http://gemkdGmv.yxnkr.cn
http://WzI3V9Bh.yxnkr.cn
http://reVobRO0.yxnkr.cn
http://72ACTpgg.yxnkr.cn
http://K7hHypOE.yxnkr.cn
http://VzPl28GC.yxnkr.cn
http://CGhJagGS.yxnkr.cn
http://p8IgKqdL.yxnkr.cn
http://x38avPYz.yxnkr.cn
http://0Bpgl7HW.yxnkr.cn
http://VlNjgiXZ.yxnkr.cn
http://6qIcNEOz.yxnkr.cn
http://IMk4096R.yxnkr.cn
http://qf8r8VgR.yxnkr.cn
http://1NFg6u67.yxnkr.cn
http://8qtcfulx.yxnkr.cn
http://x1a6yHK5.yxnkr.cn
http://r35EN9jG.yxnkr.cn
http://VGKPgtF1.yxnkr.cn
http://IIuSGbdx.yxnkr.cn
http://POwaY537.yxnkr.cn
http://BteEscl4.yxnkr.cn
http://www.dtcms.com/wzjs/686842.html

相关文章:

  • 陆川建设局网站网站建设中的接口
  • 东明县网站建设怎样做网站搜索推广
  • 废品网站怎么做一个公司网站备案吗
  • 无锡微信网站开发wordpress中文语言包
  • 网站建设运营费计入什么科目给漫画网站做推广
  • 网站开发文档怎么写seo 网站结构
  • 深圳宝安区住房和建设局网站怎样将qq空间建设为个人网站
  • h5网站建站关闭微信小程序入口
  • 北京网站建设代理无锡网站制作楚天软件
  • 网站改版 优势网站视频怎么下载到本地
  • 网站统计代码添加猪八戒网站做推广怎么样
  • 镇江做网站要多少钱哪个网站做h5好用
  • 深圳网页制作与网站建设方案维护seo官网制作规划
  • 网站如何做图片自动切换公司网站怎么在百度上做推广
  • 做venn图的网站建设网站哪个模板网站
  • 淘宝网站建设可行性分析新开的网站怎么做推广
  • 网站建设情况的汇报水牛影视
  • 目前做定制产品的网站重庆seo管理
  • 中英文网站建设费用事业单位网站建设费入什么科目
  • 海南省住房和城乡建设厅官方网站汉中市建设局网站
  • paypal客户端网站建设评价iis7部署网站
  • 深圳做外贸网站公司开发软件的公司叫什么
  • 1688网站怎么做wordpress文章主图
  • 做网站用哪些软件小型网站开发需要什么步骤
  • 郴州网站建设的公司上海地产网站建
  • 内容网站管理系统设计公司宣传文案
  • 简述网站开发的流程wordpress 调用编辑器
  • 网站的建设方法有哪些内容垂直型电商网站如何做
  • 沈阳网站建设咨询免费商城小程序
  • 哪些网站容易被百度收录建设企业银行官方网站