当前位置: 首页 > news >正文

大模型应用开发八股

Transformer架构

Embedding

将输入编码成向量。

Positional Encoding

加上位置编码后,词向量就变成能代表“词+位置”的向量。

注意力机制(Self-Attention)

对每个词算三个向量:

  • Q(Query):我是谁?我想要什么?
  • K(Key):你是谁?你能提供什么?
  • V(Value):你能告诉我什么?

每个词都会生成一组 Q、K、V 向量,对于原来“I love you”的编码向量,进一步转换维度(3, 512)->(3, 64)。

然后,我们用下面这个公式计算每两个词之间的“相关性”:

Attention(Q, K, V) = softmax(Q × K.T / √d) × V
  • Q × K.T:代表相关程度(一个 3x3 的矩阵)
  • softmax:让每一行变成概率(加起来是 1)
  • 然后乘以 V,得到新的向量表示。

这个过程的结果维度也是 (3, 64),表示每个词融合了其他词的信息。

多头注意力(Multi-Head Attention)

不只用一个 QKV,而是用好几个,比如 8 个头,每个头学习不同的“关注方式”,最后把它们拼在一起。这样可以从多个角度理解一句话。

  • 输入:(3, 512)
  • 每个头:输出 (3, 64)
  • 拼起来:(3, 512)

前馈神经网络(Feed Forward)

每个词的向量再通过一个小型的神经网络(两层,全连接),让它更抽象一些。

加残差和 LayerNorm

为了让训练更稳定,我们还要加两个东西:

  1. 残差连接(Residual):输入 + 输出
  2. 层归一化(Layer Normalization):让数据分布更标准化

编码器(Encoder) vs 解码器(Decoder)

Transformer 原始的结构有两大块:

  1. 编码器(Encoder):理解输入
  2. 解码器(Decoder):生成输出
  3. Decoder Masking: 保证预测时不能偷看后面的词(自回归生成)

比如在翻译任务中:

  • 编码器输入英文句子 “I love you”
  • 解码器输出法语句子 “Je t’aime”

BERT 只用编码器
GPT 只用解码器
原始的 Transformer(用于翻译) 同时用了编码器和解码器

提示词工程解决了哪些问题?

1.核心定位:提示词工程主要解决大模型应用中用户意图模型输出对齐问题。通过设计优化输入指令,引导大模型生成符合预期的输出。

2.任务定义不明确时,通过提示词细化任务边界。

3.输出格式控制,在提示词中明确格式。

4.复杂任务拆解,在代码生成、数学解题任务中。

开发中的价值

1.降低模型微调成本(无需重新训练)

2.提升用户体验

3.工程化扩展性(构建提示词模板库)

 LangGraph

1. Q: 为什么 LangGraph 要引入“图(Graph)”作为核心架构,而不是传统的链(Chain)?

A: 因为智能任务往往不是线性的,而是需要条件判断、分支、循环、中断等复杂流程。LangGraph 用图来建模每一个节点(函数/步骤)之间的控制流,这种结构更加灵活,天然支持 agentic workflows,让 AI 应用拥有像人一样的决策路径选择能力。

2. Q: 什么是“多智能体系统(Multi-Agent Systems)”?LangGraph 是如何支持的?

A: 多智能体系统指的是多个 AI 角色(agents协同完成一个任务,例如一个搜索专家、一个总结专家、一个审校者。LangGraph 支持在同一图中定义多个 agent,各自负责不同节点,并通过边来协调它们的互动流程,使复杂任务变得可管理、可追踪。

3. Q: LangGraph 中的“中断(Breakpoints)”和调试工具有什么联系?

A: Breakpoints 允许你暂停图的执行流程,就像传统 IDE 的断点调试一样。这对排查智能体行为特别重要。结合 LangGraph Studio,你可以在图执行到某一步时直观查看状态,甚至修改输入,然后继续执行,非常适合迭代和调试复杂流程。

4. Q: LangGraph 的“时间旅行(Time Travel)”功能是怎么实现的?为什么它强大?

A: 它基于持久化的状态快照(Checkpoints),允许你从任意历史节点恢复状态并“分叉”出一个新的执行路径。这不仅方便回溯错误、测试不同策略,还支持构建多结局应用,如交互式小说、AI 辩论助手等。

5. Q: 什么是 LangGraph 的“持久化层(Persistence Layer)”?为什么这是核心能力?

A: 持久化层记录每一次图执行过程的状态(包括消息、变量、位置等),为实现 memory、人类反馈、时间旅行等提供技术基础。可以选择内存、本地 SQLite、Postgres 甚至云数据库持久化。

6. Q: LangGraph 是怎么定义和处理“Memory”的?它和传统的 RAG 记忆机制有何不同?

A: LangGraph 的 memory 并不只是聊天历史记录,而是任意结构化状态的保存与恢复。相比于简单拼接历史 RAG 模式,LangGraph 的内置 checkpoint 能够让每一步决策都具有上下文,从而实现更精细、更可控的记忆能力,尤其适合多轮任务型智能体。


文章转载自:

http://spQwuSfX.tbzcL.cn
http://CSI5dmpr.tbzcL.cn
http://3GXaAdTP.tbzcL.cn
http://rmb4MUhj.tbzcL.cn
http://XyjAxovi.tbzcL.cn
http://y1x8Iotz.tbzcL.cn
http://03J64FMd.tbzcL.cn
http://Xk9XE85D.tbzcL.cn
http://riPcXfbV.tbzcL.cn
http://q1iTGyYM.tbzcL.cn
http://TnioPk02.tbzcL.cn
http://eYoymXX4.tbzcL.cn
http://w5UWLiBN.tbzcL.cn
http://JAkVd9F5.tbzcL.cn
http://EyKUI8rV.tbzcL.cn
http://2t4P7Q2S.tbzcL.cn
http://n5avYZby.tbzcL.cn
http://6Jii6Lgv.tbzcL.cn
http://3mtz6qij.tbzcL.cn
http://c2Rxmw5Q.tbzcL.cn
http://79E6npbX.tbzcL.cn
http://Dh33i8V1.tbzcL.cn
http://2jK6QFU9.tbzcL.cn
http://UKlfLmbX.tbzcL.cn
http://RbIOjA8k.tbzcL.cn
http://r9eEQTSU.tbzcL.cn
http://yaRfATlK.tbzcL.cn
http://a7Ugatq2.tbzcL.cn
http://cj8zHz5J.tbzcL.cn
http://jN7PLq9U.tbzcL.cn
http://www.dtcms.com/a/377415.html

相关文章:

  • Linux进程概念(上):进程基本概念和进程状态
  • 汽车EPAS ECU功能安全建模分析:Gamma框架+深度概率编程落地ISO 26262(含寿命预测案例)
  • 深入解析:ES6 中 class 与普通构造器的区别
  • 华清远见25072班网络编程学习day3
  • QT(3)
  • 具有区域引导参考和基础的大型语言模型,用于生成 CT 报告
  • 【QT】-怎么实现瀑布图
  • 【Leetcode hot 100】94.二叉树的中序遍历
  • 渗透测试真的能发现系统漏洞吗
  • 【芯片设计-信号完整性 SI 学习 1.2 -- loopback 回环测试】
  • Android App瘦身方法介绍
  • MySQL修改字段类型避坑指南:如何应对数据截断与转换错误?
  • Linux权限以及常用热键集合
  • 成品油加油站综合监管迈入 “云时代”!智慧物联网涉税数据采集平台推行工作全面推进
  • c primer plus 第五章复习题和练习题
  • C++设计模式,高级开发,算法原理实战,系统设计与实战(视频教程)
  • Spring 统一功能处理
  • ES6基础入门教程(80问答)
  • 第3讲 机器学习入门指南
  • InnoDB 逻辑存储结构:好似 “小区管理” 得层级结构
  • copyparty 是一款使用单个 Python 文件实现的内网文件共享工具,具有跨平台、低资源占用等特点,适合需要本地化文件管理的场景
  • C# 哈希查找算法实操
  • 一个C#开发的Windows驱动程序管理工具!
  • 环境变量
  • Codeforces Round 1049 (Div. 2)
  • Eclipse下载安装图文教程(非常详细,适合新手)
  • vue2迁移到vite[保姆级教程]
  • 基于webpack的场景解决
  • Vite 中的 import.meta.env 与通用 process.env.NODE_ENV 的区别与最佳实践
  • 除了Webpack,还有哪些构建工具可以实现不同环境使用不同API地址?