当前位置: 首页 > wzjs >正文

mooc 网站建设情况建筑工程网络教育网

mooc 网站建设情况,建筑工程网络教育网,vi设计 站酷,漳浦网站制作在llamafactory框架训练好模型之后,自测chat时模型效果不错,但是部署到vllm模型上效果却很差 这实际上是因为llamafactory微调时与vllm部署时的对话模板不一致导致的。 对应的llamafactory的代码为 而vllm启动时会采用大模型自己本身设置的对话模板信息…

在llamafactory框架训练好模型之后,自测chat时模型效果不错,但是部署到vllm模型上效果却很差

这实际上是因为llamafactory微调时与vllm部署时的对话模板不一致导致的。

对应的llamafactory的代码为

而vllm启动时会采用大模型自己本身设置的对话模板信息

那么要让两个对话模板一致该如何解决呢?

在上面的template.py同级目录下写入代码,将json格式的对话模板转成jinja格式

# mytest.py
import sys
import os# 将项目根目录添加到 Python 路径
root_dir = os.path.dirname(os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__)))))
sys.path.append(root_dir)from llamafactory.data.template import TEMPLATES
from transformers import AutoTokenizer# 1. 初始化分词器(任意支持的分词器均可)
tokenizer = AutoTokenizer.from_pretrained("/root/autodl-tmp/model/Qwen/Qwen2.5-VL-3B-Instruct")# 2. 获取模板对象
template_name = "qwen"  # 替换为你需要查看的模板名称
template = TEMPLATES[template_name]# 3. 修复分词器的 Jinja 模板
template.fix_jinja_template(tokenizer)# 4. 直接输出模板的 Jinja 格式
print("=" * 40)
print(f"Template [{template_name}] 的 Jinja 格式:")
print("=" * 40)
print(tokenizer.chat_template)

运行上面的代码之后就会得到jinja格式的对话模板,将它存放进chat-template.jinja

{%- if tools %}{{- '<|im_start|>system\n' }}{%- if messages[0]['role'] == 'system' %}{{- messages[0]['content'] }}{%- else %}{{- 'You are a helpful assistant.' }}{%- endif %}{{- "\n\n# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}{%- for tool in tools %}{{- "\n" }}{{- tool | tojson }}{%- endfor %}{{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
{%- else %}{%- if messages[0]['role'] == 'system' %}{{- '<|im_start|>system\n' + messages[0]['content'] + '<|im_end|>\n' }}{%- else %}{{- '<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n' }}{%- endif %}
{%- endif %}
{%- for message in messages %}{%- if (message.role == "user") or (message.role == "system" and not loop.first) or (message.role == "assistant" and not message.tool_calls) %}{{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}{%- elif message.role == "assistant" %}{{- '<|im_start|>' + message.role }}{%- if message.content %}{{- '\n' + message.content }}{%- endif %}{%- for tool_call in message.tool_calls %}{%- if tool_call.function is defined %}{%- set tool_call = tool_call.function %}{%- endif %}{{- '\n<tool_call>\n{"name": "' }}{{- tool_call.name }}{{- '", "arguments": ' }}{{- tool_call.arguments | tojson }}{{- '}\n</tool_call>' }}{%- endfor %}{{- '<|im_end|>\n' }}{%- elif message.role == "tool" %}{%- if (loop.index0 == 0) or (messages[loop.index0 - 1].role != "tool") %}{{- '<|im_start|>user' }}{%- endif %}{{- '\n<tool_response>\n' }}{{- message.content }}{{- '\n</tool_response>' }}{%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}{{- '<|im_end|>\n' }}{%- endif %}{%- endif %}
{%- endfor %}
{%- if add_generation_prompt %}{{- '<|im_start|>assistant\n' }}
{%- endif %}

启动vllm推理框架时

vllm serve model(模型)--chat-template ./path-to-chat-template.jinja(jinja对话模板地址)

http://www.dtcms.com/wzjs/568313.html

相关文章:

  • 用asp做网站优势wordpress浏览最多的文章
  • 成都装修网站制作价格可以做网站的公司
  • 一键网站模块深圳企业学校网站建设
  • 网站首页全屏怎么做产品设计优秀作品
  • vue做门户网站计算机毕业设计作品网站
  • 网站建设开发教程视频网站建设贰金手指下拉壹玖
  • 制作一个简单网站的代码全站flash网站
  • 网站高端浙江省住建厅网站
  • 官方购物网站正品深圳市龙岗区住房和建设局
  • 微信商城登录平台需要优化的网站有哪些
  • 杭州企业网站专业设计本地手机网站建设服务
  • 网站突然打不开的原因是翻译企业网站建设
  • 做会所网站的朋友圈广告投放价格表
  • 多用户网络商城360网站seo
  • 北京做网站比较好的公司深圳罗湖
  • 网站建站建设的公司网站推广优化趋势
  • 晋江网站建设企业免费商标图案 创意
  • 网站可信认证多少钱电信宽带做网站服务器
  • 做招聘网站需要什么回合制网页游戏大全
  • 苏州高端网站制作官网泰安手机网站建设报价
  • 国外免费可以做网站的服务器直缝钢管网站建设
  • 写作网站投稿哪个好上海网站建设哪家专业
  • 中亿丰建设集团股份有限公司官方网站新开的网站建设公司如何推广
  • 2019销售网站开发与设计现状亚马逊关键词搜索工具
  • 服务 好的网站制作甘孜热门抖音代运营
  • 网站等保建设灯饰如何做网站推广
  • 无锡网站建设 微信河口区建设工程招标网站
  • 青岛网站建设与推广网站运营与管理第二版
  • 网站站长工具长沙模板建站服务公司
  • 如何搭建一个简单的网站sw网站建设