当前位置: 首页 > news >正文

AI时代基础入门

文章目录

  • 基础概念介绍
  • 大模型工作流程
    • 调用大模型参数
    • 提示词工程
  • Agent
    • Agent是什么
      • Agent流程图
      • 自己创建一个Agent
      • 添加记忆
      • 添加工具
      • 其他Agent框架

基础概念介绍

人工智能概念简介:
在这里插入图片描述

现在的大模型都是通过深度学习这种算法学习出来的

大模型工作流程

1.分词
对输入的句子进行分词,比如我想去北京, 拆分成【我,想,去,北京】 (分词有不同的拆分策略,比如一个字一个字,或者说根据常用词语等)
拆分出来的单个的词都对应一个token, 每一个token又对应一个token id,这样我们就会得到一个token id列表。
在这里插入图片描述
2.根据给定的文本预测下一个token
根据第一步我们得到了一个token列表,第二步其实就是开始生成,根据最大概率原则生成下一个token。再把新生成的token加入到列表中,如此循环往复,这个过程叫做自回归。直至输出特殊token(如句号对应的token)或者长度达到阈值。
这个概率是怎么预测的呢? 是通过Transformer预测的。
在这里插入图片描述

调用大模型参数

temperature(温度):
语义相似度,一般是0-1,当为0的时候,同一个问题的回复的相似度是最高的,也更贴合人类的回复。
为1的时候是最低的,这个时候回复就倾向于不同的结果,会更具有发散性,但并不是很直接准确。

提示词工程

提示词决定了大模型给我们怎样的反馈,答案正确与否, 所以提示词很关键
怎样用提示词?
1.明确目标: 你希望大模型为你做什么
2.对于复杂任务,自己拆分步骤,引导大模型
3.明确上下文,给出自己的背景信息

Agent

Agent是什么

大模型可以接受输入,可以分析&推理,但是缺无法进行规划,思考,无法调用外部工具,资源去解决问题,也无法拥有人类的记忆能力。

AI Agent是基于LLM(大语言模型)的能够自主理解,规划,执行复杂任务的智能体。
更直白的理解就是基于LLM的代理人,本质上还是涌现LLM的能力,Agent的大脑还是LLM.

Agent的设计是为了解决大模型无法直接解决的问题,尤其是这些问题涉及多个任务或者说外部数据的情况。

Agent流程图

Planning(规划) :
智能体会对任务进行拆分, 并规划任务执行流程,同时对执行过程进行反思和思考,从而决定是否继续执行任务或者是结束任务

Memory(记忆):
分为短期记忆和长期记忆,
长期记忆指的是外部知识库,通常用向量数据库进行检索和搜索。 长期存在
短期记忆指的是一次任务的上下文, 任务结束清空

Tools(工具库):
为智能体配备的工具API, 比如:数据库搜索,代码执行器, 计算器等等。

Action(执行):
最后就是执行,根据规划和记忆进行执行,这个过程中可能调用外部的API.

在这里插入图片描述

自己创建一个Agent

其实已经有开源的Agent框架了,比如说LangChain,我们只需要调用接口即可。
在这里插入图片描述

在这里插入图片描述

添加记忆

在这里插入图片描述

添加工具

在这里插入图片描述
在这里插入图片描述

其他Agent框架

在这里插入图片描述

今天的分享就到这里了,有问题可以在评论区留言,均会及时回复呀.
我是bling,未来不会太差,只要我们不要太懒就行, 咱们下期见.
在这里插入图片描述

http://www.dtcms.com/a/283261.html

相关文章:

  • 卷积神经网络(CNN)最本质的技术
  • 离线环境中将现有的 WSL 1 升级到 WSL 2
  • list类的常用接口实现及迭代器
  • [BJDCTF2020]Cookie is so stable
  • Mybatis07-缓存
  • 正确选择光伏方案设计软件:人力成本优化的关键一步
  • 聊聊自己的新书吧
  • lustre设置用户配额
  • 同态加密赋能大模型医疗文本分析:可验证延迟压缩的融合之道
  • xss-labs靶场前八关
  • C语言基础:循环练习题
  • Linux切换到Jenkins用户解决Jenkins Host key verification failed
  • Electron实现“仅首次运行时创建SQLite数据库”
  • 大语言模型幻觉检测:语义熵揭秘
  • [Mysql] Connector / C++ 使用
  • AutoMQ 正式通过 SOC 2 Type II 认证
  • 尚庭公寓-----day1 业务功能实现
  • 八、DMSP/OLS、NPP/VIIRS等夜间灯光数据能源碳排放空间化——碳排放空间分级、空间自相关
  • PyCharm高效入门指南
  • docker+小皮面板
  • TCP 三次握手与四次挥手笔记
  • 光伏气象数据驱动设计方案优化
  • Spider的用法
  • 搭建云途YTM32B1MD1芯片VSCODE+GCC + Nijia + Cmake+Jlink开发环境
  • Python设计模式深度解析:单例模式(Singleton Pattern)完全指南
  • 深度解析api-ms-win-crt-runtime-l1-1-0.dll:它是什么?为什么重要?如何修复?
  • Spring MVC中@PathVariable的用法详解
  • 【世纪龙】汽车发动机拆装检修仿真教学软件-数字技术重塑教学
  • 汽车数字化——65页大型汽车集团企业IT信息化(管理架构、应用架构、技术架构)战略规划【附全文阅读】
  • 网络安全初级(Python实现sql自动化布尔盲注)