当前位置: 首页 > news >正文

Active-Prompt:结合思维链的主动提示用于大型语言模型

摘要

大型语言模型(LLMs)的规模不断扩大,带来了处理各种需要推理的复杂任务(如算术和常识推理)的涌现能力。已知的是,有效设计特定任务的prompt对于LLMs生成高质量答案的能力至关重要。特别地,对于复杂的问答任务,一种有效的方法是基于示例的链式思维(CoT)推理prompt,这种方式能显著提升LLMs的性能。然而,当前的CoT方法依赖于一组固定的人类标注示例,这些示例并不一定是针对不同任务最有效的样本。本文提出了一种新方法Active-Prompt,以带有人为设计的CoT推理的特定任务示例prompt,使LLMs能够适应不同的任务。为此,我们提出了一个关键问题的解决方案,即如何从一组特定任务的查询中确定哪些问题最值得被标注。借鉴不确定性驱动主动学习相关问题的思想,我们引入了若干度量标准来表征不确定性,从而选择最不确定的问题进行标注。实验结果表明我们提出的方法具有优越性能,在八个复杂推理任务上取得了领先的表现。对不同不确定性度量、数据池大小、zero-shot学习能力和准确性-不确定性关系的进一步分析展示了我们方法的有效性。

1 引言

大型语言模型(LLMs)(Raffel et al., 2020;Brown et al., 2020;Chowdhery et al., 2022;Zha

相关文章:

  • ElasticSearch入门详解
  • Git初始化相关配置
  • GO语言内存管理结构
  • Nginx的增强与可视化!OpenResty Manager - 现代化UI+高性能反向代理+安全防护
  • Flutter基础()
  • 【C/C++】无符号调试:GDB解栈实战指南
  • 学习和测试WebApi项目限制客户端ip访问接口(基于中间件)
  • 深度学习入门:从神经网络基础到前向传播全面解析
  • [洛谷刷题8]
  • Redis三种高可用模式的使用场景及特点的详细介绍
  • # KVstorageBaseRaft-cpp 项目 RPC 模块源码学习
  • JVM中的安全点是什么,作用又是什么?
  • 苍穹外卖-创建阿里云oss工具包
  • 缓存(4):常见缓存 概念、问题、现象 及 预防问题
  • 关于物联网的基础知识(一)
  • 串口通讯
  • 【东枫科技】使用LabVIEW进行NVIDIA CUDA GPU 开发
  • 数据库分库分表实战指南:从原理到落地
  • ARMV8 RK3399 u-boot TPL启动流程分析 --start.S
  • JVM-类加载子系统
  • 硅料收储挺价“小作文”发酵光伏板块罕见大涨,知情人士:确实在谈
  • “水运江苏”“航运浙江”,江浙两省为何都在发力内河航运?
  • 郑培凯:汤显祖的“至情”与罗汝芳的“赤子之心”
  • 济南市委副秘书长吕英伟已任历下区领导
  • 三大股份制银行入局AIC,一级市场再迎“活水”
  • 马上评丨学术不容“近亲繁殖”