当前位置: 首页 > news >正文

大模型开发学习笔记

文章目录

  • 大模型基础
    • 大模型的使用
    • 大模型训练的阶段
    • 大模型的特点及分类
    • 大模型的工作流程
      • 分词化(tokenization)与词表映射
    • 大模型的应用
  • 进阶
    • agent的组成和概念
    • planning规划
      • 子任务分解
      • ReAct框架
    • memory记忆
    • Tools工具\工具集的使用
    • langchain
      • 认知框架
        • ReAct框架
        • plan-and-Execute计划与执行
        • self-ask(自问自答)
        • thinking and self-refection思考并自我反思
      • ReAct框架实例
      • 通过llamindex实现ReAct RAG Agent
      • agent数字人项目实战
    • 提示词\提示词工程
      • prompt提示词是什么?
      • prompt结构
      • 做大模型项目和应用,需要用到的前置知识
  • 大模型核心知识
    • AI领域名词

大模型基础

foundational Models,基础模型或称基座模型,即大模型

大模型的使用

prompt engineering(提示词工程)

大模型训练的阶段

  1. 预训练
  2. SFT(监督微调)
  3. RLHF(基于人类反馈的强化学习)

大模型的特点及分类

  • 适应性灵活性强

  • 广泛数据集的预训练

  • 计算资源需求大

  • 参数规模大

  • 大语言模型

  • 多模态模型(计算机视觉\语音)

大模型的工作流程

分词化(tokenization)与词表映射

  • 词粒度,适用英文
  • 字符粒度,中文分词
  • 子词粒度,将单词分解为更小的单位
  • 每一个token通过预先设置好的词表,映射为一个tokenid,这是token的身份证

大模型的应用

理解人类或自己本身,就能很好的学会大模型应用及开发

进阶

agent的组成和概念

在这里插入图片描述
memory + tools + Planning + Action <-----agent

agent的决策流程
在这里插入图片描述

planning规划

子任务分解

思维链(chain of thoughs,CoT)
思维树(Tree of thoughs,ToT),使用深度优先或广度优先搜索
在这里插入图片描述

ReAct框架

搜索高端手机,最好用的手机
组合推理和行动.首先通过推理确定搜索"苹果手机",并从外部环境中观察结果.随着推理的深入,识别出需要搜索…几轮交互后,得出标准答案

memory记忆

智能体中的记忆机制

  • 形成记忆,大模型训练参数得到的记忆
  • 短期记忆,当前任务的暂存记忆
  • 长期记忆,长期保留的信息,通常用向量数据库来存储和检索

Tools工具\工具集的使用

使用工具突破大模型本身的限制

langchain

agent只是实现智能体的框架,真正的大脑还是LLM

认知框架

ReAct框架

在这里插入图片描述

plan-and-Execute计划与执行

在这里插入图片描述

self-ask(自问自答)

在这里插入图片描述

thinking and self-refection思考并自我反思

在这里插入图片描述

ReAct框架实例

我的理解是langchain已经在这些认知框架中把提示词封装好了,不用我们去手写了

通过llamindex实现ReAct RAG Agent

agent数字人项目实战

技术栈:agent + RAG + webRPC + docker
一些技术是要收费的

提示词\提示词工程

以上我的理解是对的,不同适用场景的AI工具,就是将提示词工程提前封装了,不用再让用户\使用者麻烦地定义\构建提示词

  1. 精确性
  2. 灵活性多样性
  3. 风格

prompt提示词是什么?

适用大模型时,向其输入的指令
prompt构建的原则?

  • 清晰明确,提供充足的上下文
  • 使用标点符号更清晰
  • 用样例数据指引模型输出
  • 分步骤引导
  • 一般用json格式,效果最好

prompt结构

  1. context上下文(上下文),角色\任务\知识
  2. instruction命令,步骤\思维链\示例
  3. input data输入数据,句子\文章\问题
  4. output indicator,输出格式
    在这里插入图片描述

做大模型项目和应用,需要用到的前置知识

docker-compose是用来批量启动项目中每个服务的

大模型核心知识

AI领域名词

  • 知识库
  • Embeding(嵌入)
  • prompt engineer
  • RAG(检索增强生成) 说明图
  • Finetuning(微调)
  • AI agent(AI 代理人)
    RAG

相关文章:

  • Java 自旋锁:实现机制与优化策略
  • 【Bootstrap V4系列】学习入门教程之 表格(Tables)和画像(Figure)
  • 动态思维——AI与思维模型【91】
  • java 进阶 1.0
  • 详解SLAM中的李群和李代数(上)
  • 【学习笔记】机器学习(Machine Learning) | 第五章(2)| 分类与逻辑回归
  • 2025-2026 XCPC
  • C语言 指针(3)
  • Arduino按键开关编程详解
  • TS 安装
  • 二叉搜索树的判断(双指针解决)
  • redis持久化-RDB
  • 提示词版本化管理:AI开发中被忽视的关键环节
  • 数字智慧方案6197丨智慧用电一体化服务运营解决方案(34页PPT)(文末有下载方式)
  • Linux 常用命令合集
  • 我的日记杂文
  • 截图软件、画图软件、左右分屏插件、快捷键
  • 【大模型面试每日一题】Day 6:分布式训练中 loss 出现 NaN,可能原因及排查方法?
  • 实战交易策略 篇二十二:情绪流龙头交易策略
  • 学习笔记:Qlib 量化投资平台框架 — OTHER COMPONENTS/FEATURES/TOPICS
  • 围绕“工程智能”系统布局,同济大学官宣成立五大研究院
  • 三部门印发《2025年深入推进IPv6规模部署和应用工作要点》
  • 视频|黎明:年轻人已经不相信爱情了吗?
  • 新华社原香港分社副社长、深圳市委原副书记秦文俊逝世
  • 家国万里·时光故事会|构筑中国船舰钢筋铁骨,她在焊花里展现工匠风范
  • 李洋谈美国黑帮电影与黑帮文化