当前位置: 首页 > news >正文

Datawhale AI夏令营 大模型技术task3 稍稍提分

之前只是把baseline跑了一遍(不过教师模式换成了Qwen3-32B),但是跑出来还没8B的baseline的结果好,这次提分主要是以下几个方面:
(1)完善单字段查询问题 ,增加了几种问题的问法

(2)多字段过滤 → 新增:如“在{候车厅}候车,且发车时间晚于{时间}的车有哪些?”

(3)时间推理 → 新增:“{车次}在{站名}的停留时间是多少?”

(4)缺失数据检测 → 新增:“检票口为X,且开点时间缺失的车次?”

(5)单位换算 → 新增:“若延误X分钟,新的开点时间是?”

略微优化了一下prompt,并且构造了一些错误问答对,让模型在无法回答时可以判断问题本身是错误的,不回答问题(输出无法回答或其他语句)
把32B模型教师换回了8B(32B生成答案有些慢)

最终得分:65分

还有很多地方可以优化:
下一步:
换用更好的教师模型
现在的缺失值补充直接使用无数据,有些随意,后面需要用其他方式补充
还没有使用到text2sql和agent调用工具等方法来获得更多的问答对,以及更精确的问题,现在的问答对完全使用大模型生成,其中一些涉及到计算的地方会有错误,跨行的问答以及类似RAG上下文也没有考虑到

http://www.dtcms.com/a/307118.html

相关文章:

  • 密码学安全性简介
  • LLM—— 基于 MCP 协议(Stdio 模式)的工具调用实践
  • 从一开始的网络攻防(十三):WAF入门到上手
  • 疏老师-python训练营-Day30模块和库的导入
  • Mysql事务基础
  • 通俗易懂的解释G1垃圾收集器
  • 学习Markdown
  • vulhub-Thales靶场攻略
  • git的开发流程
  • # C语言:20250730学习(二级指针)
  • OneCode 3.0 快速视图在 DDD 领域模型中的应用研究
  • 「Linux命令基础」管理文件
  • 【动态规划 | 多状态问题】动态规划求解多状态问题
  • 7. 传输层协议 TCP
  • 低速信号设计之 MDIO 篇
  • 7.5将模块分离到不同的文件中
  • FastAPI入门:表单数据、表单模型、请求文件、请求表单与文件
  • 电商项目统一认证方案设计与实战
  • 《JWT + OAuth2统一认证授权:企业级单点登录方案》
  • 【硬件-笔试面试题】硬件/电子工程师,笔试面试题-50,(知识点:TCP/IP 模型)
  • NSGA-III(Non-dominated Sorting Genetic Algorithm III)简介
  • MySQL数据一致性与主从延迟深度解析:从内核机制到生产实践
  • 数据集相关类代码回顾理解 | DataLoader\datasets.xxx
  • 广东省省考备考(第六十一天7.30)——资料分析、数量(强化训练——重点复习回顾)
  • 数据库初阶笔记
  • JavaWeb笔记14
  • C语言15-构造数据类型、位运算符、内存管理
  • Ⅹ—6.计算机二级综合题15---18套
  • 魔塔社区上文生图大模型对比
  • 涉及实验(随机分组)的一些概念