当前位置：首页 > news >正文

大模型开发学习笔记

news 2025/7/5 11:27:08

文章目录

大模型基础
- 大模型的使用
- 大模型训练的阶段
- 大模型的特点及分类
- 大模型的工作流程
- - 分词化(tokenization)与词表映射
- 大模型的应用
进阶
- agent的组成和概念
- planning规划
- - 子任务分解
  - ReAct框架
- memory记忆
- Tools工具\工具集的使用
- langchain
- - 认知框架
  - - ReAct框架
    - plan-and-Execute计划与执行
    - self-ask(自问自答)
    - thinking and self-refection思考并自我反思
  - ReAct框架实例
  - 通过llamindex实现ReAct RAG Agent
  - agent数字人项目实战
- 提示词\提示词工程
- - prompt提示词是什么?
  - prompt结构
  - 做大模型项目和应用,需要用到的前置知识
大模型核心知识
- AI领域名词

大模型基础

foundational Models，基础模型或称基座模型，即大模型

大模型的使用

prompt engineering（提示词工程）

大模型训练的阶段

预训练
SFT（监督微调）
RLHF(基于人类反馈的强化学习)

大模型的特点及分类

适应性灵活性强
广泛数据集的预训练
计算资源需求大
参数规模大
大语言模型
多模态模型(计算机视觉\语音)

大模型的工作流程

分词化(tokenization)与词表映射

词粒度,适用英文
字符粒度,中文分词
子词粒度,将单词分解为更小的单位
每一个token通过预先设置好的词表,映射为一个tokenid,这是token的身份证

大模型的应用

理解人类或自己本身,就能很好的学会大模型应用及开发

进阶

agent的组成和概念

在这里插入图片描述
memory + tools + Planning + Action <-----agent

agent的决策流程
在这里插入图片描述

planning规划

子任务分解

思维链(chain of thoughs,CoT)
思维树(Tree of thoughs,ToT),使用深度优先或广度优先搜索
在这里插入图片描述

ReAct框架

搜索高端手机,最好用的手机
组合推理和行动.首先通过推理确定搜索"苹果手机",并从外部环境中观察结果.随着推理的深入,识别出需要搜索…几轮交互后,得出标准答案

memory记忆

智能体中的记忆机制

形成记忆,大模型训练参数得到的记忆
短期记忆,当前任务的暂存记忆
长期记忆,长期保留的信息,通常用向量数据库来存储和检索

Tools工具\工具集的使用

使用工具突破大模型本身的限制

langchain

agent只是实现智能体的框架,真正的大脑还是LLM

认知框架

ReAct框架

在这里插入图片描述

plan-and-Execute计划与执行

在这里插入图片描述

self-ask(自问自答)

在这里插入图片描述

thinking and self-refection思考并自我反思

在这里插入图片描述

ReAct框架实例

我的理解是langchain已经在这些认知框架中把提示词封装好了,不用我们去手写了

通过llamindex实现ReAct RAG Agent

agent数字人项目实战

技术栈:agent + RAG + webRPC + docker
一些技术是要收费的

提示词\提示词工程

以上我的理解是对的,不同适用场景的AI工具,就是将提示词工程提前封装了,不用再让用户\使用者麻烦地定义\构建提示词

精确性
灵活性多样性
风格

prompt提示词是什么?

适用大模型时,向其输入的指令
prompt构建的原则?

清晰明确,提供充足的上下文
使用标点符号更清晰
用样例数据指引模型输出
分步骤引导
一般用json格式,效果最好

prompt结构

context上下文(上下文),角色\任务\知识
instruction命令,步骤\思维链\示例
input data输入数据,句子\文章\问题
output indicator,输出格式

做大模型项目和应用,需要用到的前置知识

docker-compose是用来批量启动项目中每个服务的

大模型核心知识

AI领域名词

知识库
Embeding(嵌入)
prompt engineer
RAG(检索增强生成) 说明图
Finetuning(微调)
AI agent(AI 代理人)

http://www.dtcms.com/a/169270.html

相关文章：

Java 自旋锁：实现机制与优化策略

【Bootstrap V4系列】学习入门教程之表格（Tables）和画像（Figure）

动态思维——AI与思维模型【91】

java 进阶 1.0

详解SLAM中的李群和李代数（上）

【学习笔记】机器学习(Machine Learning) | 第五章(2)| 分类与逻辑回归

2025-2026 XCPC

C语言指针(3)

Arduino按键开关编程详解

TS 安装

二叉搜索树的判断（双指针解决）

redis持久化-RDB

提示词版本化管理：AI开发中被忽视的关键环节

数字智慧方案6197丨智慧用电一体化服务运营解决方案（34页PPT）（文末有下载方式）

Linux 常用命令合集

我的日记杂文

截图软件、画图软件、左右分屏插件、快捷键

【大模型面试每日一题】Day 6：分布式训练中 loss 出现 NaN，可能原因及排查方法？

实战交易策略篇二十二：情绪流龙头交易策略

学习笔记：Qlib 量化投资平台框架 — OTHER COMPONENTS/FEATURES/TOPICS

仿腾讯会议——主界面设计创建房间加入房间客户端实现

Linux管道识

Qt 中基于 QTableView + QSqlTableModel 的分页搜索与数据管理实现

双向链表详解

日语学习-日语知识点小记-构建基础-JLPT-N4阶段（1４）：かもしれません（～た・～ない）ほうがいいです

兰亭妙微分享：B 端设计如何实现体验跃迁

依赖倒置原则（DIP）

DeepSeek-R1模型蒸馏

Demo02_基于寄存器+标准库开发的项目

vulkanscenegraph显示倾斜模型(6.2)-记录与提交