当前位置: 首页 > wzjs >正文

网奇e游通旅游网站品牌策划方案模板

网奇e游通旅游网站,品牌策划方案模板,搜狗推广后台登录,线上营销有哪些一 序言 最近训练大模型,但是发现微调了很多模型,都希望部署起来,但是如果把模型合并,然后每个都去加载模型,发现成本太高了。心想能不能只加载基座模型,然后分别加载微调权重,这样成本比较低&…

一 序言

最近训练大模型,但是发现微调了很多模型,都希望部署起来,但是如果把模型合并,然后每个都去加载模型,发现成本太高了。心想能不能只加载基座模型,然后分别加载微调权重,这样成本比较低,也方便。顺着这个思路,发现vllm可以这样做,于是在此记录该做法。

二代码

本次实验是基于Qwen2.5-72B-Instruct微调的

from vllm impirt LLM, SamplingParams
from vllm.lora.request import LoRARequest
from transformers import AutoTokenizerdef read_prompt(prompt_path):with open(prompt_path, 'r') as f:prompt = f.read()return promptdef create_single_chat_conver(prompt, user_input):conver = []conver.append({"role":"system", "content":prompt})conver.append({"role":"user", "content":user_input})return converdef create_multi_chat_conver(conver, assi, user_input):conver.append("role":"assistant", "content":assi)conver.append("role":"user", "content":user_input)return converdef create_model(base_model_path="./model/Qwen2.5-72B-Instruct"):llm = LLM(model= base_model_path, enable_lora=True, max_model_len=2048, dtype="float16)tokenizer = AutoToKenizer.from_pretrained(base_model_path)return vllm, tokenizerdef generate_text_lora(messages, tokenizer, vllm, lora_request):input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_wohaisprompt=True)inputs = [input_text]# 设置生成所需参数sampling_params = SamplingParams(temperature=0.7, top_p=0.8, top_k=50, max_tokens=2048)outputs = vllm.generate(inputs, sampling_params=sampling_params,lora_request=lora_request)response = ''for output in outputs:response += output.outputs[0].textreturn responsedef generate_text(messages, tokenizer, vllm):input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_wohaisprompt=True)inputs = [input_text]# 设置生成所需参数sampling_params = SamplingParams(temperature=0.7, top_p=0.8, top_k=50, max_tokens=2048)outputs = vllm.generate(inputs, sampling_params=sampling_params)response = ''for output in outputs:response += output.outputs[0].textreturn responseif __name__ == "__main__":# 提示词路径prompt_path = './prompt.pbt'# 输入文本data_path = './input_txt.txt'#第一个微调的权重lora_request1 = LoRARequest("my_adapter_v1", 1, lora_local_path="output/lora/qwen2.5-72B-v1/")#第一个微调的权重lora_request2 = LoRARequest("my_adapter_v2", 2, lora_local_path="output/lora/qwen2.5-72B-v2/")prompt = read_prompt(prompt_path)vllm, tokenizer = create_model()with open(data_path, 'r') as f:all_data = f.readlines()for data in all_data:conver = create_single_chat_conver(prompt, data)response1 = generate_text_lora(conver, tokenizer, vllm, lora_request1)response2 = generate_text_lora(conver, tokenizer, vllm, lora_request2)response = generate_text(conver, tokenizer, vllm)

三总结

以上都是伪代码,仅做参考学习使用

http://www.dtcms.com/wzjs/595193.html

相关文章:

  • 做网站的开发环境贵州互联网公司
  • 共享备案网站下列哪个软件属于网页制作软件
  • 瓷器网站源码wordpress主题图片路径换取l
  • 做网站运营的简历大型多媒体网站建设工具
  • ftp两个网站子域名的绑定个人可以自己做网站吗
  • 网站建设相对路径自助建站网站
  • 音乐网站开发需求网络引流怎么做啊?
  • 做外汇消息面的网站网站怎么做推广和宣传语
  • 代做毕业设计网站有哪些广告在线制作图片
  • 公司网站模板下载手机应用软件开发app
  • 网站是怎么建立起来的公司网站设计规范
  • 网站建设最新技术知名的wordpress模板
  • 外国酷炫网站国家域名管理中心
  • php 上传移动到网站根目录推广软件是什么意思
  • 重庆百度整站优化网站域名在哪买
  • 笨笨网站建设专家wordpress升级怎么退回
  • 游戏网站免费入口重庆森林经典台词图片
  • wordpress情侣网站源码谷歌seo推广公司
  • 网站建设为了什么网站高端
  • 网站设计 站深圳市南山区住房和建设局网站
  • 昭通网站建设 hardlcp个人空间备案网站名称
  • 免费域名注册平台桔子seo
  • 做兼职网站赚钱吗微信如何做公众号
  • 漯河知名网站建设价格建设银行网站可以打印流水吗
  • 网站怎么备案在哪里下载南昌网站建设公司服务器
  • dedecms公司网站怎么做微商产品展示网站源码
  • 襄阳市建设工程质量监督站网站搜索关键词分析
  • c 还可以做网站删除的网站做404
  • 网站优化 英文百度推广工具
  • 祺越网站建设太原百度关键词优化