当前位置: 首页 > news >正文

STaR: Self-Taught Reasoner Bootstrapping Reasoning With Reasoning论文笔记

前言

STaR: Self-Taught Reasoner
Bootstrapping Reasoning With Reasoning

斯坦福和google research共同的论文

link:https://arxiv.org/pdf/2203.14465

一、 方法

  • 数据集包含 少量cot的数据和不包含cot的大量数据集。

1.1 通过少量cot fewshot生成

通过少量逻辑的样例,生成回答大量问题的逻辑

把少量的带有逻辑的示例,当作Prompt中的few shot引导llm生成cot范式的response

1.2 Refine

对于生成答案如果正确,则生成带有cot正确的response和原本的prompt组合成一个训练数据

对于答案错误的,则通过在输入Prompt中hint正确答案,根据正确答案来引导模型生成正确的cot逻辑

1.3 训练

最终对于可以生成正确答案的response和prompt做训练,反复迭代这个过程

二、实验结果

相关文章:

  • RSYNC+IONTIFY数据实时同步
  • 设备故障预测与健康管理技术:从数据到决策的工业智能进化之路​
  • 【编译原理】期末复习
  • MySQL基础函数篇
  • 二刷苍穹外卖 day03
  • 没掌握的知识点记录
  • SCP拷贝文件命令以及其它上传下载文件方式总结
  • 查询消耗 IO 多的 SQL -达梦
  • 国产12537穿甲弹侵彻仿真(显式动力学)
  • Python期末速成
  • UMAP:用于降维的均匀流形近似和投影实验
  • MongoDB 8.0.10 windows11安装记录
  • Python SQLModel 简单使用
  • 《计算机网络:自顶向下方法(第8版)》Chapter 8 课后题
  • 链接脚本基础语法
  • 面试150 除自身以外数组的乘积
  • 今日推荐:data-engineer-handbook
  • 包教包会,ES6类class的基本入门
  • 本地编译LibreHardwareMonitor
  • 仕么是Transformer以及工作原理和架构
  • 网页设计制作音乐网站/打广告去哪个平台免费
  • 夜夜做新郎网站在线视频/网店代运营公司靠谱吗
  • 网站开发流程丽江/百度pc端首页
  • 国外做的不错的网站/百度网络优化
  • 网站开发编程/推广app用什么平台比较好
  • 网站建设设计官网/公司宣传网站制作