当前位置: 首页 > news >正文

【智能体】Ch3-提升模型性能的定向学习(Enhancing model performance with targeted learning)

目录

  • 使用LangChain快速开始Agent
  • 使用 Vertex AI Agent 的生产应用
  • 总结(Summary)

有效使用模型的一个关键方面是它们在生成输出时能够选择正确的工具,尤其是在大规模生产中使用工具时。虽然通用训练帮助模型发展这种技能,但现实世界的场景常常需要超越训练数据的知识。可以想象这就像基础烹饪技能与特定菜系精通之间的区别。两者都需要基础的烹饪知识,但后者需要定向学习以获得更细致的结果。
为了帮助模型获得这种特定知识,有几种方法存在:
· 上下文学习(In-context learning):这种方法在推理时为通用模型提供提示、工具和少量示例,使其能够“即时”学习如何以及何时使用这些工具来完成特定任务。ReAct框架是这种在自然语言中的一种应用。
· 基于检索的上下文学习(Retrieval-based in-context learning):该技术通过从外部记忆中检索最相关的信息、工具和关联示例,动态填充模型提示。例如,Vertex AI扩展中的’Example Store’或之前提到的数据存储RAG架构。
· 微调学习(Fine-tuning based learning):此方法通过在推理之前使用更大的特定示例集训练模型,帮助模型在接到用户查询前了解如何以及何时应用某些工具。
为了提供每种定向学习方法的额外见解,我们可以重温烹饪类比。
· 想象一位厨师收到了一份特定的食谱(提示)、一些关键食材(相关工具)和顾客提供的一些示例菜品(少量示例)。基于这些有限的信息和厨师的烹饪常识,他们将需要“即时”弄清楚怎样最贴近地准备菜品满足食谱和顾客的偏好。这是上下文学习。
· 现在想象我们的厨师在一个备货充足的厨房里(外部数据存储),那里有各种食材和烹饪书籍(示例和工具)。厨师现在能够从储藏室中动态选择食材和烹饪书籍,更好地与顾客的食谱和偏好对齐。这使厨师能够利用
http://www.dtcms.com/a/456944.html

相关文章:

  • 【LLM】大模型vibe coding(cursor、copilot、comate)
  • 如何创建网站教程视频react做前台网站
  • Web 开发 24
  • 深入理解RNN及其变体:从传统RNN到LSTM、GRU(附PyTorch实战)
  • Linux 服务器常见的性能调优
  • 济南网站价格wordpress tag模板代码
  • 飞牛nas配置息屏不关机
  • 【ThreeJs】【伪VR】用 Three.js 实现伪 VR 全景看房系统:低成本实现 3D 级交互体验
  • Java Spring “Bean” 面试清单(含超通俗生活案例与深度理解)
  • 生活琐记(6)
  • Python高效数据分析从入门到实战的七个步骤
  • 长沙网站制作关键词推广在线咨询 1 网站宣传
  • 使用中sql注意点
  • 【Python刷力扣hot100】283. Move Zeroes
  • 虹口北京网站建设如何添加网站
  • 【blog webp一键转换为 png】
  • Swift:现代、安全、高效的编程语言
  • WinMerge下载和安装教程(附安装包,图解版)
  • Python中的访问控制机制: Effective Python 第42条
  • 好多钱网站视频网站开发工程师
  • 基于单片机的客车载客状况自动检测系统设计(论文+源码)
  • Java Spring “IOC + DI”面试清单(含超通俗生活案例与深度理解)
  • Day18_常用linux指令
  • 听课笔记CSAPP
  • 如何避免消息重复投递或重复消费
  • 卷积层(Convolutional Layer)学习笔记
  • centos7.6系统python3安装IOPaint (原Lama-Cleaner)
  • Shell脚本基础应用
  • 107、23种设计模式之观察者模式(16/23)
  • Linux进程第五讲:PPID与bash的关联、fork系统调用的原理与实践操作(上)