当前位置: 首页 > wzjs >正文

网站在哪里备案网络技术推广服务

网站在哪里备案,网络技术推广服务,wordpress 十大插件,马云先做那个网站的起家的在llamafactory框架训练好模型之后,自测chat时模型效果不错,但是部署到vllm模型上效果却很差 这实际上是因为llamafactory微调时与vllm部署时的对话模板不一致导致的。 对应的llamafactory的代码为 而vllm启动时会采用大模型自己本身设置的对话模板信息…

在llamafactory框架训练好模型之后,自测chat时模型效果不错,但是部署到vllm模型上效果却很差

这实际上是因为llamafactory微调时与vllm部署时的对话模板不一致导致的。

对应的llamafactory的代码为

而vllm启动时会采用大模型自己本身设置的对话模板信息

那么要让两个对话模板一致该如何解决呢?

在上面的template.py同级目录下写入代码,将json格式的对话模板转成jinja格式

# mytest.py
import sys
import os# 将项目根目录添加到 Python 路径
root_dir = os.path.dirname(os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__)))))
sys.path.append(root_dir)from llamafactory.data.template import TEMPLATES
from transformers import AutoTokenizer# 1. 初始化分词器(任意支持的分词器均可)
tokenizer = AutoTokenizer.from_pretrained("/root/autodl-tmp/model/Qwen/Qwen2.5-VL-3B-Instruct")# 2. 获取模板对象
template_name = "qwen"  # 替换为你需要查看的模板名称
template = TEMPLATES[template_name]# 3. 修复分词器的 Jinja 模板
template.fix_jinja_template(tokenizer)# 4. 直接输出模板的 Jinja 格式
print("=" * 40)
print(f"Template [{template_name}] 的 Jinja 格式:")
print("=" * 40)
print(tokenizer.chat_template)

运行上面的代码之后就会得到jinja格式的对话模板,将它存放进chat-template.jinja

{%- if tools %}{{- '<|im_start|>system\n' }}{%- if messages[0]['role'] == 'system' %}{{- messages[0]['content'] }}{%- else %}{{- 'You are a helpful assistant.' }}{%- endif %}{{- "\n\n# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}{%- for tool in tools %}{{- "\n" }}{{- tool | tojson }}{%- endfor %}{{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
{%- else %}{%- if messages[0]['role'] == 'system' %}{{- '<|im_start|>system\n' + messages[0]['content'] + '<|im_end|>\n' }}{%- else %}{{- '<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n' }}{%- endif %}
{%- endif %}
{%- for message in messages %}{%- if (message.role == "user") or (message.role == "system" and not loop.first) or (message.role == "assistant" and not message.tool_calls) %}{{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}{%- elif message.role == "assistant" %}{{- '<|im_start|>' + message.role }}{%- if message.content %}{{- '\n' + message.content }}{%- endif %}{%- for tool_call in message.tool_calls %}{%- if tool_call.function is defined %}{%- set tool_call = tool_call.function %}{%- endif %}{{- '\n<tool_call>\n{"name": "' }}{{- tool_call.name }}{{- '", "arguments": ' }}{{- tool_call.arguments | tojson }}{{- '}\n</tool_call>' }}{%- endfor %}{{- '<|im_end|>\n' }}{%- elif message.role == "tool" %}{%- if (loop.index0 == 0) or (messages[loop.index0 - 1].role != "tool") %}{{- '<|im_start|>user' }}{%- endif %}{{- '\n<tool_response>\n' }}{{- message.content }}{{- '\n</tool_response>' }}{%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}{{- '<|im_end|>\n' }}{%- endif %}{%- endif %}
{%- endfor %}
{%- if add_generation_prompt %}{{- '<|im_start|>assistant\n' }}
{%- endif %}

启动vllm推理框架时

vllm serve model(模型)--chat-template ./path-to-chat-template.jinja(jinja对话模板地址)

http://www.dtcms.com/wzjs/457012.html

相关文章:

  • 做威士忌的网站百度广告联盟网站
  • 济南建设厅官方网站百度怎么优化网站排名
  • 今日中国新闻广州seo网站管理
  • 一元云购网站建设模块神点击恶意点击软件
  • 南昌 网站建设网站设计公司有哪些
  • 建设企业网站可信度搜索引擎营销的优缺点
  • 手机可以做网站的服务器吗百度知道网址
  • 手机域名网站怎么做更先进的seo服务
  • 郑州网站推广数据分析师要学什么
  • 赣州那里有做网站的公司东莞疫情最新情况
  • 北京互联网公司网站建设企业如何建立网站
  • dedecms网站邮件程序sem推广什么意思
  • 出名的网站有哪些免费建站平台
  • 网站开发外包报价在线h5免费制作网站
  • 网站轮播广告动画怎么做百度广告投放平台官网
  • 网站建设实施计划包括哪些启信聚客通网络营销策划
  • 章莹颖被卖做性奴网站一个网站的seo优化有哪些
  • 建站源码白杨seo
  • 哪个网站做电子请帖好全网营销推广平台
  • 黄骅网站建设搜索seo神器
  • 青海做高端网站建设的公司企业网站是什么
  • 官方网站下载安装云支付微商引流的最快方法是什么
  • 品牌网站建设小蝌蚪1a网络营销推广网站
  • 做电商的批发网站有哪些seo双标题软件
  • wordpress网站响应时间关键词推广营销
  • python做网页保定百度推广优化排名
  • 泰安手机网站建设公司管理培训课程大全
  • 国内做网站比较好的公司你就知道首页
  • 怎样做一家网站在线推广网站的方法
  • 宁波高端网站设计价格爱站网挖掘关键词