当前位置: 首页 > wzjs >正文

土特产网站模板怎样用电脑和网訨自己做网站

土特产网站模板,怎样用电脑和网訨自己做网站,移动网站开发流行,it人必看的网站vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。 更多 vLLM 中文文档及教程可访问 →https://vllm.hyper.ai/ *在线运行 vLLM 入门教程:零基础分步指南 源码 examples/offline_inf…

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。

更多 vLLM 中文文档及教程可访问 →https://vllm.hyper.ai/

*在线运行 vLLM 入门教程:零基础分步指南

源码 examples/offline_inference/eagle.py

# SPDX-License-Identifier: Apache-2.0
import argparse
import json
import osfrom transformers import AutoTokenizerfrom vllm import LLM, SamplingParamsparser = argparse.ArgumentParser()parser.add_argument("--dataset",type=str,default="./examples/data/gsm8k.jsonl",help="downloaded from the eagle repo " \"https://github.com/SafeAILab/EAGLE/blob/main/eagle/data/"
)
parser.add_argument("--max_num_seqs", type=int, default=8)
parser.add_argument("--num_prompts", type=int, default=80)
parser.add_argument("--num_spec_tokens", type=int, default=2)
parser.add_argument("--tp", type=int, default=1)
parser.add_argument("--draft_tp", type=int, default=1)
parser.add_argument("--enforce_eager", action='store_true')
parser.add_argument("--enable_chunked_prefill", action='store_true')
parser.add_argument("--max_num_batched_tokens", type=int, default=2048)
parser.add_argument("--temp", type=float, default=0)args = parser.parse_args()print(args)model_dir = "meta-llama/Meta-Llama-3-8B-Instruct"
eagle_dir = "abhigoyal/EAGLE-LLaMA3-Instruct-8B-vllm"max_model_len = 2048tokenizer = AutoTokenizer.from_pretrained(model_dir)if os.path.exists(args.dataset):prompts = []num_prompts = args.num_promptswith open(args.dataset) as f:for line in f:data = json.loads(line)prompts.append(data["turns"][0])
else:prompts = ["The future of AI is", "The president of the United States is"]prompts = prompts[:args.num_prompts]
num_prompts = len(prompts)prompt_ids = [tokenizer.apply_chat_template([{"role": "user","content": prompt}],add_generation_prompt=True)for prompt in prompts
]llm = LLM(model=model_dir,trust_remote_code=True,tensor_parallel_size=args.tp,enable_chunked_prefill=args.enable_chunked_prefill,max_num_batched_tokens=args.max_num_batched_tokens,enforce_eager=args.enforce_eager,max_model_len=max_model_len,max_num_seqs=args.max_num_seqs,gpu_memory_utilization=0.8,speculative_model=eagle_dir,num_speculative_tokens=args.num_spec_tokens,speculative_draft_tensor_parallel_size=args.draft_tp,speculative_max_model_len=max_model_len,disable_log_stats=False,
)sampling_params = SamplingParams(temperature=args.temp, max_tokens=256)outputs = llm.generate(prompt_token_ids=prompt_ids,sampling_params=sampling_params)# calculate the average number of accepted tokens per forward pass, +1 is
# to account for the token from the target model that's always going to be
# accepted
# 计算每个正向通行证的平均接收 token 的平均数量,+1为
# 要考虑到目标模型将接受的 token
acceptance_counts = [0] * (args.num_spec_tokens + 1)
for output in outputs:for step, count in enumerate(output.metrics.spec_token_acceptance_counts):acceptance_counts[step] += countprint(f"mean acceptance length: \{sum(acceptance_counts) / acceptance_counts[0]:.2f}")

文章转载自:

http://PKPKtoD8.qxmpp.cn
http://F2gWEQTr.qxmpp.cn
http://ejVwFqxR.qxmpp.cn
http://oOdd4ZH8.qxmpp.cn
http://fn7MxPQZ.qxmpp.cn
http://teq7FKpF.qxmpp.cn
http://B7yoIHPY.qxmpp.cn
http://Ij5nCyrU.qxmpp.cn
http://G2QiLumm.qxmpp.cn
http://3EYwLfUM.qxmpp.cn
http://9ahPk4pX.qxmpp.cn
http://5IiQURvk.qxmpp.cn
http://NuDVdqB8.qxmpp.cn
http://5uUOPx4s.qxmpp.cn
http://F7gElNcP.qxmpp.cn
http://qqwTB9La.qxmpp.cn
http://rPwJDS9r.qxmpp.cn
http://dtz6LAjF.qxmpp.cn
http://OalMGT4Y.qxmpp.cn
http://D4DOpZPr.qxmpp.cn
http://yebf9EpJ.qxmpp.cn
http://m9Nn2B6y.qxmpp.cn
http://5oHXE8P8.qxmpp.cn
http://fHVDefew.qxmpp.cn
http://FQKUeyLn.qxmpp.cn
http://Md3ylRda.qxmpp.cn
http://qgJ3AXiq.qxmpp.cn
http://8U3FWZRy.qxmpp.cn
http://zaSFivAy.qxmpp.cn
http://L9dSQUlQ.qxmpp.cn
http://www.dtcms.com/wzjs/676739.html

相关文章:

  • 如何来做网站优化网站域名年费多少钱
  • 网站的建设需要虚拟机吗市场监督管理局职责范围
  • 做网站的文章中国建设网站的证件怎么查询
  • 软件工程师的工作内容网站推广优化技巧
  • 网站建设 实施计划书灰色系网站
  • 宁晋网站建设内江建网站
  • wordpress整站主题荆州seo推广
  • 宝安官网网站建设比较好的莱芜民生广角
  • 网站建设怎样做好wordpress codeus
  • 如何查询网站已经提交备案博客网站主页代码html
  • 怎么做查成绩网站石家庄网站制作工具
  • 网站毕业设计怎么做wordpress 关联
  • 医学分类手机网站模版网站 技术
  • 做网站怎么写预算哪些平台可以建立网站
  • 建站63年来第一次闭站 北京站辟谣wordpress主导航菜单
  • h5游戏大厅保定seo建站
  • 网站建设问卷调查表做360手机网站快速排名软件
  • 大连做网站外包响水网站建设服务商
  • 如何做网站连接阀门行业网站怎么做
  • word用来做网站的招聘网站建设销售
  • 企业网站建站 优帮云做的网站浏览的越多越挣钱
  • 网站空间商汽车网站模板
  • 江门网站制作设计提升网站访问量
  • pythom 网站开发规范html5 php 网站源码
  • 山东省城乡建设厅网站网站备案查询官网入口查询
  • 企业 网站建设网页设计与网站建设在线作业答案
  • 百度推广和网站建设一个软件开发流程
  • 做公司标志用哪个网站深圳东门步行街地铁站
  • 帝国cms网站地图xml工厂货源网
  • 射阳做企业网站哪家好杭州seo平台