当前位置: 首页 > news >正文

Active-Prompt:结合思维链的主动提示用于大型语言模型

摘要

大型语言模型(LLMs)的规模不断扩大,带来了处理各种需要推理的复杂任务(如算术和常识推理)的涌现能力。已知的是,有效设计特定任务的prompt对于LLMs生成高质量答案的能力至关重要。特别地,对于复杂的问答任务,一种有效的方法是基于示例的链式思维(CoT)推理prompt,这种方式能显著提升LLMs的性能。然而,当前的CoT方法依赖于一组固定的人类标注示例,这些示例并不一定是针对不同任务最有效的样本。本文提出了一种新方法Active-Prompt,以带有人为设计的CoT推理的特定任务示例prompt,使LLMs能够适应不同的任务。为此,我们提出了一个关键问题的解决方案,即如何从一组特定任务的查询中确定哪些问题最值得被标注。借鉴不确定性驱动主动学习相关问题的思想,我们引入了若干度量标准来表征不确定性,从而选择最不确定的问题进行标注。实验结果表明我们提出的方法具有优越性能,在八个复杂推理任务上取得了领先的表现。对不同不确定性度量、数据池大小、zero-shot学习能力和准确性-不确定性关系的进一步分析展示了我们方法的有效性。

1 引言

大型语言模型(LLMs)(Raffel et al., 2020;Brown et al., 2020;Chowdhery et al., 2022;Zha

http://www.dtcms.com/a/184120.html

相关文章:

  • ElasticSearch入门详解
  • Git初始化相关配置
  • GO语言内存管理结构
  • Nginx的增强与可视化!OpenResty Manager - 现代化UI+高性能反向代理+安全防护
  • Flutter基础()
  • 【C/C++】无符号调试:GDB解栈实战指南
  • 学习和测试WebApi项目限制客户端ip访问接口(基于中间件)
  • 深度学习入门:从神经网络基础到前向传播全面解析
  • [洛谷刷题8]
  • Redis三种高可用模式的使用场景及特点的详细介绍
  • # KVstorageBaseRaft-cpp 项目 RPC 模块源码学习
  • JVM中的安全点是什么,作用又是什么?
  • 苍穹外卖-创建阿里云oss工具包
  • 缓存(4):常见缓存 概念、问题、现象 及 预防问题
  • 关于物联网的基础知识(一)
  • 串口通讯
  • 【东枫科技】使用LabVIEW进行NVIDIA CUDA GPU 开发
  • 数据库分库分表实战指南:从原理到落地
  • ARMV8 RK3399 u-boot TPL启动流程分析 --start.S
  • JVM-类加载子系统
  • 机器学习极简入门:从基础概念到行业应用
  • 锚定基础与拥抱融合:C 语言在编程教育与技术社区的破圈之路
  • 全模态具身智能:从 VLM 到 MLLM
  • Java大师成长计划之第18天:Java Memory Model与Volatile关键字
  • 单片机-STM32部分:13、PWM
  • STM32智能窗帘系统:从零到一的开发实战
  • 开源字体设计工具字玩 FontPlayer
  • “爱生活”小项目问题总结
  • 【大模型】解决最新的Dify1.3.1版本 无法基于Ollama成功添加模型
  • LabVIEW的PID参数自适应控制