当前位置: 首页 > wzjs >正文

网站flash音乐播放器网站的维护方案

网站flash音乐播放器,网站的维护方案,网站实现微信登录,哪个设计培训机构好一 序言 最近训练大模型,但是发现微调了很多模型,都希望部署起来,但是如果把模型合并,然后每个都去加载模型,发现成本太高了。心想能不能只加载基座模型,然后分别加载微调权重,这样成本比较低&…

一 序言

最近训练大模型,但是发现微调了很多模型,都希望部署起来,但是如果把模型合并,然后每个都去加载模型,发现成本太高了。心想能不能只加载基座模型,然后分别加载微调权重,这样成本比较低,也方便。顺着这个思路,发现vllm可以这样做,于是在此记录该做法。

二代码

本次实验是基于Qwen2.5-72B-Instruct微调的

from vllm impirt LLM, SamplingParams
from vllm.lora.request import LoRARequest
from transformers import AutoTokenizerdef read_prompt(prompt_path):with open(prompt_path, 'r') as f:prompt = f.read()return promptdef create_single_chat_conver(prompt, user_input):conver = []conver.append({"role":"system", "content":prompt})conver.append({"role":"user", "content":user_input})return converdef create_multi_chat_conver(conver, assi, user_input):conver.append("role":"assistant", "content":assi)conver.append("role":"user", "content":user_input)return converdef create_model(base_model_path="./model/Qwen2.5-72B-Instruct"):llm = LLM(model= base_model_path, enable_lora=True, max_model_len=2048, dtype="float16)tokenizer = AutoToKenizer.from_pretrained(base_model_path)return vllm, tokenizerdef generate_text_lora(messages, tokenizer, vllm, lora_request):input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_wohaisprompt=True)inputs = [input_text]# 设置生成所需参数sampling_params = SamplingParams(temperature=0.7, top_p=0.8, top_k=50, max_tokens=2048)outputs = vllm.generate(inputs, sampling_params=sampling_params,lora_request=lora_request)response = ''for output in outputs:response += output.outputs[0].textreturn responsedef generate_text(messages, tokenizer, vllm):input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_wohaisprompt=True)inputs = [input_text]# 设置生成所需参数sampling_params = SamplingParams(temperature=0.7, top_p=0.8, top_k=50, max_tokens=2048)outputs = vllm.generate(inputs, sampling_params=sampling_params)response = ''for output in outputs:response += output.outputs[0].textreturn responseif __name__ == "__main__":# 提示词路径prompt_path = './prompt.pbt'# 输入文本data_path = './input_txt.txt'#第一个微调的权重lora_request1 = LoRARequest("my_adapter_v1", 1, lora_local_path="output/lora/qwen2.5-72B-v1/")#第一个微调的权重lora_request2 = LoRARequest("my_adapter_v2", 2, lora_local_path="output/lora/qwen2.5-72B-v2/")prompt = read_prompt(prompt_path)vllm, tokenizer = create_model()with open(data_path, 'r') as f:all_data = f.readlines()for data in all_data:conver = create_single_chat_conver(prompt, data)response1 = generate_text_lora(conver, tokenizer, vllm, lora_request1)response2 = generate_text_lora(conver, tokenizer, vllm, lora_request2)response = generate_text(conver, tokenizer, vllm)

三总结

以上都是伪代码,仅做参考学习使用

http://www.dtcms.com/wzjs/782984.html

相关文章:

  • asp做网站策划书本地门户网站
  • 个人或企业做网络贸易的主要网站推广竞价
  • 网站制作 手机版网站内外链怎么做
  • 英文网站源码屯济宁做网站公司
  • 那些企业网站做的较好全文搜索引擎有哪些
  • 我公司网站开发技术优势舆情报告2023
  • 专业做网站的团队七牛云加速WordPress
  • 茌平做网站推广广告设计排行榜
  • 企业网站可信度建设门户一号wordpress主题
  • 徐州泉山建设局网站网页翻译怎么弄
  • 玉溪网站建设网站建设网站设计公司成都
  • 网站开发前端是什么大型电商平台有哪些
  • 企业网站策划建设方案百度上海华亮建设集团网站
  • 邯郸建设信息网站厦门网站网页设
  • 哪家做网站公司棋牌网站建设多少钱
  • 校园门户网站 建设怎么找有赞做网站
  • 沈阳世纪兴网站建设在网站设计中 网页框架设计
  • 湖北省建设主管网站微博搜索引擎优化
  • 隆尧网站制作 天堂中文在线官网
  • 网站界面尺寸中国制造网网站类型
  • 亚马逊欧洲站vat怎么申请学生管理系统 网站开发
  • 做爰视频在线观看免费网站二维码网站建设
  • 网站开发语言网站开发使用什么软件
  • 皖icp备 网站建设想学网站建设什么的
  • 网站建设实训室介绍网站源码下载 用户注册
  • 集团公司网站方案江西建筑工程网
  • 手机网站js特效1核做网站
  • 湖南网站开发公司手机网站制作方法
  • 网站报备查询网站为什么做微云的采集
  • app开发 wordpress怎么优化自己网站的关键词