当前位置: 首页 > news >正文

调用DeepSeek系列模型问答时,输出只有</think>标签,而没有<think>标签

问题:调用DeepSeek系列模型问答时,输出结果缺少只有标签,而没有标签?

DeepSeek官方有关说明
在这里插入图片描述

这里设置成这样是为了保证让模型的生成是以"<think>\n"开头的,然后开始思考过程,避免模型没有以"<think>\n"开头而不思考直接输出结果
<think>不输出,是因为其已经属于提示词prompt的一部分了。

解决办法: 在tokenizer_config.json文件中修改chat_template

删掉"<think>\\n",但这样就可能导致模型跳过思考过程。

因此不建议直接修改。

http://www.dtcms.com/a/196150.html

相关文章:

  • CANoe CAPL TCP DoIP通信问题
  • 【springboot+vue3的前后端分离项目实现支付宝的沙箱支付】
  • 使用instance着色
  • 边缘计算:物联网的“加速器”与“守护者”
  • Postman遇到脚本不支持replaceIn函数
  • 3D个人简历网站 4.小岛
  • BootCDN介绍(Bootstrap主导的前端开源项目免费CDN加速服务)
  • 【技巧】GoogleChrome浏览器开发者模式查看dify接口
  • DeepSeek赋能电商,智能客服机器人破解大型活动人力困境
  • AtomicInteger
  • 信息收集+初步漏洞打点
  • springboot配置tomcat端口的方法
  • 单细胞转录组(3)
  • DAY28-类的定义和方法
  • 深入解析Spring Boot与Spring Security的集成实践
  • 无线数传模块支持园区多节点电力参数同步监测配置指南
  • Java 注解篇:@RequestMapping
  • 大模型技术演进与应用场景深度解析
  • LVGL- Calendar 日历控件
  • 联想笔记本黑屏了,排线出问题还是静电
  • jvm安全点(三)openjdk17 c++源码垃圾回收之安全点结束,唤醒线程
  • Mysql 8.0.32 union all 创建视图后中文模糊查询失效
  • 数字电子技术基础(五十九)——脉冲触发的触发器
  • (8)python开发经验
  • 开源安全大模型Foundation-Sec-8B实操
  • Vim编辑器命令模式操作指南
  • python打卡day28
  • Florence2代码实战
  • STM32IIC实战-OLED模板
  • 端口443在git bash向github推送时的步骤