当前位置: 首页 > wzjs >正文

wp做的网站打开域名会跳转到其他网站seo排名培训学校

wp做的网站打开域名会跳转到其他网站,seo排名培训学校,wordpress数据库导入,根据颜色找网站本系列基于Qwen2.5-7B,学习如何使用vllm量化,并使用benchmark_serving.py、lm_eval 测试模型性能和评估模型准确度。 测试环境为: OS: centos 7 GPU: nvidia l40 driver: 550.54.15 CUDA: 12.3本文是该系列第2篇——awq量化 一、量化 使用…

本系列基于Qwen2.5-7B,学习如何使用vllm量化,并使用benchmark_serving.py、lm_eval 测试模型性能和评估模型准确度。
测试环境为:

OS: centos 7
GPU: nvidia l40
driver: 550.54.15
CUDA: 12.3

本文是该系列第2篇——awq量化

一、量化

使用AutoAWQ 量化

from awq import AutoAWQForCausalLM
from transformers import AutoTokenizermodel_path = "./Qwen2.5-7B"
quant_path = "./Qwen2.5-7B-awq-int4"
quant_config = { "zero_point": True, "q_group_size": 128, "w_bit": 4, "version": "GEMM" }# Load model
model = AutoAWQForCausalLM.from_pretrained(model_path, trust_remote_code=False)
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=False)# Quantize
model.quantize(tokenizer, quant_config=quant_config)# Save quantized model
model.save_quantized(quant_path)
tokenizer.save_pretrained(quant_path)print(f'Model is quantized and saved at "{quant_path}"')

二、部署

 vllm  serve Qwen2.5-7B-awq-int4 --disable-log-requests --quantization awq --dtype="half"

三、benchmark

python /vllm/benchmarks/benchmark_serving.py --backend vllm --model Qwen2.5-7B-awq-int4 --endpoint /v1/completions --dataset-name sharegpt --dataset-path ./ShareGPT_Vicuna_unfiltered/ShareGPT_V3_unfiltered_cleaned_split.json  --num-prompts 100

结果:

============ Serving Benchmark Result ============
Successful requests:                     100
Benchmark duration (s):                  48.32
Total input tokens:                      23260
Total generated tokens:                  21979
Request throughput (req/s):              2.07
Output token throughput (tok/s):         454.85
Total Token throughput (tok/s):          936.22
---------------Time to First Token----------------
Mean TTFT (ms):                          2132.58
Median TTFT (ms):                        2277.96
P99 TTFT (ms):                           3749.79
-----Time per Output Token (excl. 1st token)------
Mean TPOT (ms):                          95.75
Median TPOT (ms):                        69.59
P99 TPOT (ms):                           309.96
---------------Inter-token Latency----------------
Mean ITL (ms):                           65.81
Median ITL (ms):                         59.83
P99 ITL (ms):                            311.10

四、lm_eval

4.1 gsm8k

lm_eval --model vllm \ --model_args pretrained="Qwen2.5-7B-awq-int4",add_bos_token=true,gpu_memory_utilization=0.5,quantization="AWQ",dtype="half"  \--tasks mmlu  \--num_fewshot 5 \--limit 250

结果:

TasksVersionFiltern-shotMetricValueStderr
gsm8k3flexible-extract5exact_match0.832±0.0237
strict-match5exact_match0.740±0.0278

4.2 mmlu

lm_eval --model vllm  \--model_args pretrained="./Qwen2.5-7B-awq-int4/",add_bos_token=true,gpu_memory_utilization=0.5,quantization="AWQ",dtype="half"  \--tasks mmlu \--num_fewshot 5 \--limit 250 \--batch_size 'auto'

结果:

GroupsVersionFiltern-shotMetricValueStderr
mmlu2noneacc0.7517±0.0041
- humanities2noneacc0.7576±0.0082
- other2noneacc0.7526±0.0084
- social sciences2noneacc0.8285±0.0077
- stem2noneacc0.6866±0.0083
http://www.dtcms.com/wzjs/452134.html

相关文章:

  • 专业番禺网站建设百度号码认证
  • 重庆旅游seo整站优化青岛seo整站优化
  • 手机网站建站系统seoul怎么读
  • 邢台做网站的公司一键生成原创文案
  • 做的网站有营销效果吗市场营销的对象有哪些
  • p2p系统网站开发手机怎么建立网站
  • 白山市城乡建设局网站抖音seo优化系统招商
  • 潍坊知名网站建设怎么收费值得收藏的五个搜索引擎
  • 创联互动建设网站上海aso
  • 网站时间显示草根seo博客
  • 编程教程免费视频长沙seo服务哪个公司好
  • 西安市城乡建设档案馆网站武汉seo计费管理
  • 部门网站建设的意义网络安全培训最强的机构
  • gta5此网站正在建设关键词优化公司哪家推广
  • 网站建设域名什么意思足球比赛统计数据
  • 红塔网站制作万江专业网站快速排名
  • 做网站 用什么语言好网络营销的作用和意义
  • 嘉兴网站建设嘉兴网站推广百度网站怎么优化排名靠前
  • 音乐网站怎么做无线增值业务批量查询神马关键词排名
  • 海口网站运营托管报价谷歌搜索引擎为什么打不开
  • 做网站接单渠道百度文库首页
  • 绚丽网站短视频营销方式有哪些
  • 网站推广的建议什么是网站推广策略
  • 效果好的免费网站建设绍兴seo推广
  • javaee做网站建设营销策略分析论文
  • ie9网站后台编辑器推广官网
  • vps做电影网站百度搜索排行榜前十名
  • 陕西省市建设委员会网站哈尔滨网络优化推广公司
  • 新建的网站打不开职业技能培训网上平台
  • 昆山建设局网站查预售公司网页制作流程