当前位置：首页 > news >正文

Teaching Small Language Models Reasoning throughCounterfactual Distillation

news 2025/7/2 19:00:55

2024.emnlp-main.333.pdfhttps://aclanthology.org/2024.emnlp-main.333.pdf

1.概述

大型语言模型（LLM），如GPT-3，在各种下游任务中表现出色，包括通过链式思维（CoT）进行问题解答。CoT鼓励模型在解决问题时生成中间推理步骤。尽管LLM取得了成功，但由于模型大小的限制，其能力仍然受到约束，特别是在应用到分布外（OOD）示例时。此外，基于提示的CoT技术对于非常大的模型非常有效，而较小的模型由于涉及的推理过程复杂，往往难以执行此类任务。

<

http://www.dtcms.com/a/51974.html

相关文章：

Hive-07之企业级调优

Docker部署MySQL

Python：简单的爬虫程序，从web页面爬取图片与标题并保存MySQL

大模型核心要素完全解析：从数字神经元到智能对话的奥秘

go语言数据类型

（50）[HGAME 2023 week2]before_main

AutoGen学习笔记系列（六）Tutorial - Termination

unittest框架核心知识的系统复习及与pytest的对比

uniapp x 学习之 uts 语言快速入门

【Embedding】何为Embedding？

筑牢网络安全防线：守护您的数据安全

单体架构、集群、分布式、微服务的区别！

Redis设计与实现-数据结构

Selenium遇到Exception自动截图

【大模型学习】第八章深入理解机器学习技术细节

【前端】【vue-i18n】安装和使用全解

Redis Stream

Ubuntu20.04 在离线机器上安装 NVIDIA Container Toolkit

[项目]基于FreeRTOS的STM32四轴飞行器: 三.电源控制

llama-factory || AutoDL平台 ||启动web界面

LeetCode1328

【JavaScript】《JavaScript高级程序设计 (第4版) 》笔记-附录C-JavaScript 库和框架

驱动开发系列43 - Linux 显卡KMD驱动代码分析（四）- DRM设备操作

[AI]从零开始的so-vits-svc歌声推理及混音教程

智能汽车制造：海康EasyNVR多品牌NVR管理平台实现无插件视频监控直播方案

数字IC后端实现教程| Clock Gating相关clock tree案例解析

构建自己的AI客服【根据用户输入生成EL表达式】

iOS安全和逆向系列教程第16篇：Frida入门与高级应用

sql sqlserver的进程资源查看，杀掉多余进程

非平稳时间序列分析（三）——季节模型（SARIMA、STL、Holt-Winters）