当前位置: 首页 > news >正文

LLM论文笔记 25: Chain-of-Thought Reasoning without Prompting

  • Arxiv日期:2024.5.31
  • 机构:Google DeepMind

关键词

  • cot-decoding
  • 推理路径
  • pretrain

核心结论

1. LLMs 不需要prompting就可以生成链式推理路径,prompting只是将这些能力显性化的一种手段

2. cot path 往往与更高的model confidence相关,可以用作可靠性的metric

3. 探索多样化的解码路径能有效挖掘模型的内在推理能力,而不仅仅依赖于模型规模或训练数据的多样性

4. CoT-Decoding 可以弥补模型未经过指令调优时的推理能力缺陷,并在指令调优的模型中进一步优化性能

5. Cot-Decoding适用于多种任务和语言模型,显示出显著的通用性和鲁棒性

主要方法

(验证了内在推理能力的存在)使用pretrain模型,不使用greedy decoding,而是在第一个token预测使用top-k发现内化cot推理能力,且带cot的答案置信度更高

置信度衡量标准:

answer中每一个token在NTP时当前token和下一个token的概率差异

注:本系列不包括基础的知识点讲解,为笔记/大纲性质而非教程,用于论文知识点和思想和快速记忆和回顾,更多细节建议阅读论文原文

相关文章:

  • 【AI】深度学习与人工智能应用案例详解
  • 数据结构之栈
  • 《 C++ 点滴漫谈: 三十一 》函数重载不再复杂:C++ 高效调试与性能优化实战
  • SwanLab飞书通知插件:训练完成收到飞书消息,掌握训练进度更及时
  • 【工具】C#防沉迷进程监控工具使用手册
  • LIN接口
  • Spring源码解析
  • SpringBoot项目中JSON数据的存储与查询
  • 【网络协议】基于UDP的可靠协议:KCP
  • Xposed模块开发:运行时修改技术
  • 全星研发管理APQP软件系统:助力汽车零部件企业高效研发,打造核心竞争力
  • MyBatis XMLMapperBuilder 是如何解析 SQL 映射文件的? 它读取了哪些信息?
  • 用Python打造AI玩家:挑战2048,谁与争锋
  • Chat2DB:让数据库管理像聊天一样简单
  • csv文件格式和excel数据格式有什么区别
  • 解决linux mysql命令 bash: mysql: command not found 的方法
  • 【AVRCP】Notification PDUs 深入解析与应用
  • Ruby 字符串(String)
  • 关于软航OFFICE文档控件软件在Chrome 133版本上提示扩展已停用的原因及处理办法
  • 通过 SVG 使用 AI 生成理想图片:技术实现与实践指南
  • “AD365特应性皮炎疾病教育项目”启动,助力提升认知与规范诊疗
  • 六连板成飞集成:航空零部件业务收入占比为1.74%,市场环境没有重大调整
  • 为什么越来越多景区,把C位留给了书店?
  • 陕西一村民被冒名贷款40余万续:名下已无贷款,将继续追责
  • 首次采用“顶置主星+侧挂从星”布局,长二丁“1箭12星”发射成功
  • 牛市早报|中方调整对美加征关税措施,五部门约谈外卖平台企业