当前位置: 首页 > news >正文

从0开始学习大模型--Day04--大模型的框架以及基本元素

Agent框架与策略分析

计划与执行(planning-and-Execute)

该框架侧重于先规划一系列的行动,然后执行。这个框架可以使大模型能够先综合考虑任务的多个方面,然后按照计划进行行动,比较适合应用在较复杂的项目管理中或者需要多步决策的场景下。

计划与执行的逻辑图

自问自答(Self-Ask)

该框架允许大模型对自己提出问题并回答,来增强对问题的理解,从而提高其给出的回答的质量,其比较适合在需要深入分析或提供创造性解决方案时是用,比如创作小说,设计艺术品的外观,解决房屋的装修规划等等。

具体过程就如字面意思一般,在向大模型提出问题后,其不仅会给出答案,还会在后续反问自己相关的问题,从而进一步地确定其答案的有效性。

思考并自我反思(Thinking and Self-Reflection)

该框架主要用于模拟和实现复杂的决策过程,通过不断自我评估和调整,是系统能够学习并改进决策过程,从而在面对复杂问题时,回答能够表现得更好。

与传统的一边思考一边行动不同,在每次思考并给出行动后,都会对其进行评估并传回LLM形成反馈,从而确保思考与行动的方向没有偏离解决问题的道路,不然很可能会出现像你画我猜游戏中的,开头是想画一只猫,最后却变成了一只狗。

ReAct框架

该框架首先会基于原有的知去思考,并审视现有的工具判断是否有帮助。当发现已有的知识不足以回答这个问题时,便会自发地去调动工具去尝试从别的渠道获取其他信息,基于新的信息重复进行推理和行动,直到完成这个任务。

ReAct框架与仅推理和仅行动的思考过程的区别

提示词与参数量

在大模型的使用过程中,我们经常会发现得不到想要的回答,他们的思考方式与我们总是不在一个频道上,这个时候,提示词的作用就是能让我们让大模型的思考方向跟我们在同一条路上,我们可以通过给大模型不同的应用场景,不同的范围提示,从而起到对其掌握的海量的数据清洗,筛选的作用。此外,还有一个关键的知识是要掌握的,就是上面提到的海量的数据,这是大模型生成回答的根本,就跟我们学习一个数学是一个循序渐进的过程,前面的学习为后面打下基础,这些就叫做参数量。

学习来源于B站教程:【基础篇】01.提示词,提示词工程是什么?(简单普及)_哔哩哔哩_bilibili

相关文章:

  • 深入探索Laravel框架中的Blade模板引擎
  • C语言 第六章 结构体(2)
  • MySQL核心内容【持续更新中】
  • 简述Linux操作系统并安装配置Linux
  • 26考研——中央处理器_指令执行过程(5)
  • 【 SVG动态拼接】前端生成阻抗电路图
  • 仁合医疗核心产品:引领医疗科技新潮流
  • LLM量化方法:ZeroQuant、LLM.int8()、SmoothQuant、GPTQ、AWQ
  • CRC 循环冗余校验
  • Vue3 + Element Plus 动态表单实现
  • vscode离线安装python插件
  • git高效杀器——cz-customizable 搭配 commitlint
  • 抖音到店摸着京东外卖过河
  • 树初步 #1(插排串联 - 辽宁省2024CCPC)
  • 【八股消消乐】你在项目中如何优化垃圾回收机制?
  • 动态规划之背包问题:组合优化中的经典NP挑战
  • 基于vue框架的电子商城m8qu8(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • WPDRRC 模型:构建动态闭环的信息安全防御体系
  • 【RAG】重点部分 RAG-Fusion, Decomposition, HyDE 和 Routing
  • apipost快捷使用实例
  • 胳膊一抬就疼,炒菜都成问题?警惕这种“炎症”找上门
  • 丰田汽车:美国关税或导致4、5月损失1800亿日元,新财年净利润下滑三成
  • 黄玮接替周继红出任国家体育总局游泳运动管理中心主任
  • 对话哭泣照被恶意盗用成“高潮针”配图女生:难过又屈辱
  • 从“重规模”向“重回报”转变,公募基金迎系统性改革
  • 昆廷·斯金纳:作为“独立自主”的自由