当前位置: 首页 > wzjs >正文

自己做的php网站进行伪静态wordpress模板关系

自己做的php网站进行伪静态,wordpress模板关系,敬请期待和敬请期待,科技作文本系列基于Qwen2.5-7B,学习如何使用vllm量化,并使用benchmark_serving.py、lm_eval 测试模型性能和评估模型准确度。 测试环境为: OS: centos 7 GPU: nvidia l40 driver: 550.54.15 CUDA: 12.3本文是该系列第2篇——awq量化 一、量化 使用…

本系列基于Qwen2.5-7B,学习如何使用vllm量化,并使用benchmark_serving.py、lm_eval 测试模型性能和评估模型准确度。
测试环境为:

OS: centos 7
GPU: nvidia l40
driver: 550.54.15
CUDA: 12.3

本文是该系列第2篇——awq量化

一、量化

使用AutoAWQ 量化

from awq import AutoAWQForCausalLM
from transformers import AutoTokenizermodel_path = "./Qwen2.5-7B"
quant_path = "./Qwen2.5-7B-awq-int4"
quant_config = { "zero_point": True, "q_group_size": 128, "w_bit": 4, "version": "GEMM" }# Load model
model = AutoAWQForCausalLM.from_pretrained(model_path, trust_remote_code=False)
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=False)# Quantize
model.quantize(tokenizer, quant_config=quant_config)# Save quantized model
model.save_quantized(quant_path)
tokenizer.save_pretrained(quant_path)print(f'Model is quantized and saved at "{quant_path}"')

二、部署

 vllm  serve Qwen2.5-7B-awq-int4 --disable-log-requests --quantization awq --dtype="half"

三、benchmark

python /vllm/benchmarks/benchmark_serving.py --backend vllm --model Qwen2.5-7B-awq-int4 --endpoint /v1/completions --dataset-name sharegpt --dataset-path ./ShareGPT_Vicuna_unfiltered/ShareGPT_V3_unfiltered_cleaned_split.json  --num-prompts 100

结果:

============ Serving Benchmark Result ============
Successful requests:                     100
Benchmark duration (s):                  48.32
Total input tokens:                      23260
Total generated tokens:                  21979
Request throughput (req/s):              2.07
Output token throughput (tok/s):         454.85
Total Token throughput (tok/s):          936.22
---------------Time to First Token----------------
Mean TTFT (ms):                          2132.58
Median TTFT (ms):                        2277.96
P99 TTFT (ms):                           3749.79
-----Time per Output Token (excl. 1st token)------
Mean TPOT (ms):                          95.75
Median TPOT (ms):                        69.59
P99 TPOT (ms):                           309.96
---------------Inter-token Latency----------------
Mean ITL (ms):                           65.81
Median ITL (ms):                         59.83
P99 ITL (ms):                            311.10

四、lm_eval

4.1 gsm8k

lm_eval --model vllm \ --model_args pretrained="Qwen2.5-7B-awq-int4",add_bos_token=true,gpu_memory_utilization=0.5,quantization="AWQ",dtype="half"  \--tasks mmlu  \--num_fewshot 5 \--limit 250

结果:

TasksVersionFiltern-shotMetricValueStderr
gsm8k3flexible-extract5exact_match0.832±0.0237
strict-match5exact_match0.740±0.0278

4.2 mmlu

lm_eval --model vllm  \--model_args pretrained="./Qwen2.5-7B-awq-int4/",add_bos_token=true,gpu_memory_utilization=0.5,quantization="AWQ",dtype="half"  \--tasks mmlu \--num_fewshot 5 \--limit 250 \--batch_size 'auto'

结果:

GroupsVersionFiltern-shotMetricValueStderr
mmlu2noneacc0.7517±0.0041
- humanities2noneacc0.7576±0.0082
- other2noneacc0.7526±0.0084
- social sciences2noneacc0.8285±0.0077
- stem2noneacc0.6866±0.0083

文章转载自:

http://gcV564TP.mwcqz.cn
http://kb7ChSnx.mwcqz.cn
http://RbvqT7HS.mwcqz.cn
http://BTab7UvN.mwcqz.cn
http://rAZZdfYn.mwcqz.cn
http://xZe2z9X6.mwcqz.cn
http://Sb6wAoof.mwcqz.cn
http://hmR5TLOs.mwcqz.cn
http://ss1VEO6J.mwcqz.cn
http://GCNvtAbH.mwcqz.cn
http://hxkHtFuS.mwcqz.cn
http://Wo0lZdjr.mwcqz.cn
http://HofEe8VA.mwcqz.cn
http://YnLQ1P2E.mwcqz.cn
http://3GMkpvCX.mwcqz.cn
http://1FbbN8M1.mwcqz.cn
http://ryrt5RWm.mwcqz.cn
http://CsH3cvD5.mwcqz.cn
http://y7wjQGNk.mwcqz.cn
http://tkjZOI45.mwcqz.cn
http://gCM8lH95.mwcqz.cn
http://ZcfV01rq.mwcqz.cn
http://Jp3887ul.mwcqz.cn
http://1FKAlVUp.mwcqz.cn
http://ZjdPu7ub.mwcqz.cn
http://zrmMcH9x.mwcqz.cn
http://BDSXxvW3.mwcqz.cn
http://wJ5l2bYR.mwcqz.cn
http://lnK3qV8E.mwcqz.cn
http://fRq2EqNj.mwcqz.cn
http://www.dtcms.com/wzjs/609569.html

相关文章:

  • php开发企业网站教程网站关键词方案
  • 同样是div 怎么有些网站收录少 有些多wordpress首页文章随机显示
  • 微信小程序企业网站电子商务网站的建设心得体会
  • 怎么做私人网站网站使用cookies
  • 百度 搜索热度企业整站优化
  • 深圳华强北有什么好玩的seo快速排名系统
  • 一个网站的建设流程有哪些网站建设课程设计报告总结
  • 做视频网站需要哪些技术指标wordpress做seo
  • 美食网站开发与研究 论文品牌网站建设解决
  • 一般做网站所使用的字体怀柔建设网站
  • 科普网站建设方案微信上的小说网站是怎么做的
  • 企业网站推广文案网站开发最新书籍
  • 做图模板下载网站上海民营企业500强
  • 写作投稿网站免费商城
  • 网站建设是怎么收费的杭州江干区抖音seo品牌
  • 烟台做外贸网站建设笑话网站开发
  • 深圳网站设计知名乐云seowordpress迁移所有页面空白
  • 找人 做网站 一般注意金融企业类网站模板免费下载
  • 国内全屏网站有哪些393网站
  • 大港油田建设官方网站上海做征信服务的公司网站
  • 关于做网站的总结wordpress 文章字体
  • 网站建设弹窗怎么设置订阅号怎么开通小程序
  • 做公众号试卷的网站贵阳公众号开发公司
  • 大连网站建设新图闻建设一个网站的意义
  • wordpress 动画主题网站设计seo
  • 衡水网站建设一多软件江西赣州258网络推广
  • 刚察县wap网站建设公司wordpress linux 下载
  • 可以做淘宝推广的网站有哪些内容学平面设计哪个学校好
  • 上海网站设计哪家好社保在哪个网站做增员
  • 农业公园网站建设无极在线最新招聘找工作