当前位置: 首页 > wzjs >正文

小型网站设计防疫测温健康码核验一体机

小型网站设计,防疫测温健康码核验一体机,建筑资质办理服务平台,哈尔滨公司网站团队一 序言 最近训练大模型,但是发现微调了很多模型,都希望部署起来,但是如果把模型合并,然后每个都去加载模型,发现成本太高了。心想能不能只加载基座模型,然后分别加载微调权重,这样成本比较低&…

一 序言

最近训练大模型,但是发现微调了很多模型,都希望部署起来,但是如果把模型合并,然后每个都去加载模型,发现成本太高了。心想能不能只加载基座模型,然后分别加载微调权重,这样成本比较低,也方便。顺着这个思路,发现vllm可以这样做,于是在此记录该做法。

二代码

本次实验是基于Qwen2.5-72B-Instruct微调的

from vllm impirt LLM, SamplingParams
from vllm.lora.request import LoRARequest
from transformers import AutoTokenizerdef read_prompt(prompt_path):with open(prompt_path, 'r') as f:prompt = f.read()return promptdef create_single_chat_conver(prompt, user_input):conver = []conver.append({"role":"system", "content":prompt})conver.append({"role":"user", "content":user_input})return converdef create_multi_chat_conver(conver, assi, user_input):conver.append("role":"assistant", "content":assi)conver.append("role":"user", "content":user_input)return converdef create_model(base_model_path="./model/Qwen2.5-72B-Instruct"):llm = LLM(model= base_model_path, enable_lora=True, max_model_len=2048, dtype="float16)tokenizer = AutoToKenizer.from_pretrained(base_model_path)return vllm, tokenizerdef generate_text_lora(messages, tokenizer, vllm, lora_request):input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_wohaisprompt=True)inputs = [input_text]# 设置生成所需参数sampling_params = SamplingParams(temperature=0.7, top_p=0.8, top_k=50, max_tokens=2048)outputs = vllm.generate(inputs, sampling_params=sampling_params,lora_request=lora_request)response = ''for output in outputs:response += output.outputs[0].textreturn responsedef generate_text(messages, tokenizer, vllm):input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_wohaisprompt=True)inputs = [input_text]# 设置生成所需参数sampling_params = SamplingParams(temperature=0.7, top_p=0.8, top_k=50, max_tokens=2048)outputs = vllm.generate(inputs, sampling_params=sampling_params)response = ''for output in outputs:response += output.outputs[0].textreturn responseif __name__ == "__main__":# 提示词路径prompt_path = './prompt.pbt'# 输入文本data_path = './input_txt.txt'#第一个微调的权重lora_request1 = LoRARequest("my_adapter_v1", 1, lora_local_path="output/lora/qwen2.5-72B-v1/")#第一个微调的权重lora_request2 = LoRARequest("my_adapter_v2", 2, lora_local_path="output/lora/qwen2.5-72B-v2/")prompt = read_prompt(prompt_path)vllm, tokenizer = create_model()with open(data_path, 'r') as f:all_data = f.readlines()for data in all_data:conver = create_single_chat_conver(prompt, data)response1 = generate_text_lora(conver, tokenizer, vllm, lora_request1)response2 = generate_text_lora(conver, tokenizer, vllm, lora_request2)response = generate_text(conver, tokenizer, vllm)

三总结

以上都是伪代码,仅做参考学习使用

http://www.dtcms.com/wzjs/311146.html

相关文章:

  • dz网站的隐藏链接怎么删除游戏推广引流软件
  • 通州网站制作网站关键词优化多少钱
  • 宁波高质量品牌网站设计厂家阳江seo
  • 直接拖拉做网站的软件怎么seo网站关键词优化
  • 学校做网站的目的百度收录教程
  • 腾讯云备案网站名称seo查询友情链接
  • 长葛哪里有做网站的关键词查询网
  • 品牌设计就是vi设计吗重庆seo推广
  • html 网站模板深圳企业黄页网
  • 有关建设旅游网站的公司排名优化工具
  • wordpress如何网页浏览数据库seo舆情优化
  • 网站设计制作上海东莞网站优化公司哪家好
  • 深圳广科网站建设定向推广
  • 商业空间设计公司福州百度seo排名软件
  • wordpress不加载样式济南seo关键词优化方案
  • 东营做网站优化的公司seo外链论坛
  • 泰州网站建设定制官方百度平台
  • 佛山网站建设公司电话营销型网站是什么意思
  • 阿里云上的网站建设关键信息基础设施安全保护条例
  • 加强廉政教育网站建设微信运营技巧
  • html网站开发心得体会优化方案官方网站
  • 4399网站开发人员 被挖走电脑培训
  • 国外那些网站是做五金批发河源seo
  • 网站注册表单怎么做好项目推荐平台
  • wordpress段首空格怎么做网站优化排名
  • 网站建设电话百度收录批量查询
  • 文化网站建设需要的功能网络营销做得比较成功的案例
  • 做网站的流程 优帮云今日足球赛事推荐
  • wordpress图片自动打水印深圳白帽优化
  • 网站维护有文化建设费百度网首页官网