当前位置：首页 > news >正文

乐学LangChain（1）：总体架构和核心组件

news 2025/10/20 9:43:08

1、LangChain资料

官网地址：https://www.langchain.com/langchain

官网文档：https://python.langchain.com/docs/introduction/

API文档：https://python.langchain.com/api_reference/

github地址：https://github.com/langchain-ai/langchain

2、总体架构图

官方最新版本虽然都已经是V1了，但是其v0.1~v0.3各版本的架构都有参考价值，大部分都是一脉相承的。

v0.1版本

V0.2 / V0.3 版本

3、内部架构详情

结构1：LangChain

langchain：构成应用程序认知架构的Chains，Agents，Retrieval strategies等。

langchain-community：第三方集成

langchain-Core：基础抽象和LangChain表达式语言 (LCEL)

结构2：LangGraph

LangGraph可以看做基于LangChain的api的进一步封装，能够协调多个Chain、Agent、Tools完成更复杂的任务，实现更高级的功能。

结构3：LangSmith

https://docs.smith.langchain.com/

链路追踪。提供了6大功能，涉及Debugging (调试)、Playground (沙盒)、Prompt Management (提示管理)、Annotation (注释)、Testing (测试)、Monitoring (监控)等。与LangChain无缝集成，帮助你从原型阶段过渡到生产阶段。

结构4：LangServe

将LangChain的可运行项和链部署为REST API，使得它们可以通过网络进行调用。

Java怎么调用langchain呢？就通过这个langserve。将langchain应用包装成一个rest api，对外暴露服务。同时，支持更高的并发，稳定性更好。

4、核心组件

LangChain的核心组件涉及六大模块，这六大模块提供了一个全面且强大的框架，使开发者能够创建复杂、高效且用户友好的基于大模型的应用。

核心组件1：Model I/O

Model I/O：标准化各个大模型的输入和输出，包含输入模版，模型本身和格式化输出。

以下是使用语言模型从输入到输出的基本流程。

以下是对每一块的总结：

Format(格式化) ：即指代Prompts Template，通过模板管理大模型的输入。将原始数据格式化成模型可以处理的形式，插入到一个模板问题中，然后送入模型进行处理。
Predict(预测) ：即指代Models，使用通用接口调用不同的大语言模型。接受被送进来的问题，然后基于这个问题进行预测或生成回答。
Parse(生成) ：即指代Output Parser 部分，用来从模型的推理中提取信息，并按照预先设定好的模版来规范化输出。比如，格式化成一个结构化的JSON对象。

核心组件2：Chains

Chain："链条"，用于将多个模块串联起来组成一个完整的流程，是 LangChain 框架中最重要的模块。例如，一个 Chain 可能包括一个 Prompt 模板、一个语言模型和一个输出解析器，它们一起工作以处理用户输入、生成响应并处理输出。

常见的Chain类型：

LLMChain ：最基础的模型调用链

SequentialChain ：多个链串联执行

RouterChain ：自动分析用户的需求，引导到最适合的链

RetrievalQA ：结合向量数据库进行问答的链

核心组件3：Memory

Memory：记忆模块，用于保存对话历史或上下文信息，以便在后续对话中使用。

常见的 Memory 类型：

ConversationBufferMemory ：保存完整的对话历史

ConversationSummaryMemory ：保存对话内容的精简摘要（适合长对话）

ConversationSummaryBufferMemory ：混合型记忆机制，兼具上面两个类型的特点

VectorStoreRetrieverMemory ：保存对话历史存储在向量数据库中

核心组件4：Agents

Agents，对应着智能体，是 LangChain 的高阶能力，它可以自主选择工具并规划执行步骤。

Agent 的关键组成：

AgentType ：定义决策逻辑的工作流模式

Tool ：是一些内置的功能模块，如API调用、搜索引擎、文本处理、数据查询等工具。Agents通

过这些工具来执行特定的功能。

AgentExecutor ：用来运行智能体并执行其决策的工具，负责协调智能体的决策和实际的工具执

行。

核心组件5：Retrieval

Retrieval：对应着RAG，检索外部数据，然后在执行生成步骤时将其传递到 LLM。步骤包括文档加载、切割、Embedding等

Source ：数据源，即大模型可以识别的多种类型的数据：视频、图片、文本、代码、文档等。
Load ：负责将来自不同数据源的非结构化数据，加载为文档(Document)对象
Transform ：负责对加载的文档进行转换和处理，比如将文本拆分为具有语义意义的小块。
Embed ：将文本编码为向量的能力。一种用于嵌入文档，另一种用于嵌入查询
Store ：将向量化后的数据进行存储
Retrieve ：从大规模文本库中检索和查询相关的文本段落

核心组件6：Callbacks

Callbacks：回调机制，允许连接到 LLM 应用程序的各个阶段，可以监控和分析LangChain的运行情况，比如日志记录、监控、流传输等，以优化性能。

回调函数，对于程序员们应该都不陌⽣。这个函数允许我们在LLM的各个阶段使⽤各种各样的

“钩⼦”，从而达实现⽇志的记录、监控以及流式传输等功能。

http://www.dtcms.com/a/503738.html

相关文章：

CAN 总线物理层介绍

yolo介绍

中国建站公司网站电线电话图怎么做

新华路街道网站建设企业为什么要建设电子商务网站

UVa 1630 Folding

基于AT89C52的智能温控风扇设计

32HAL——IIC温度传感器AHT20

站群wordpress宣武深圳网站建设公司

构建自主AI的挑战与对策：稳定性、成本与伦理安全

汽车服务站建站流程网页网站原型图占位符怎么做

高效解决重装后常见的7类系统适配问题

如何写好代码

PS2020使用教程|绘制文明行车宣传画

探索 C++ 类核心概念与不同场景下的使用技巧

权威机构统计的 AI 编程模型排名

佛山网站建设与推广学院网站群建设方案

【HTTP知识】HTTP OPTIONS 预检请求深度解析与优化策略

网站建设推广好处响应式网站开发报价

汽车MIMO雷达在多径环境下的角度估计——论文阅读

做网站的实践报告包头网站建设良居网络

【论文精度-3】POMO：强化学习中具有多个最优解的策略优化方法（Yeong-Dae Kwon 2020）

基本控件-上（Num30）

FFmpeg 基本API avcodec_find_decoder函数内部调用流程分析

用wordpress建立学校网站吗淄博公司网站建设效果

C++ std::Set＜std::pair＞

如何解决 pip install -r requirements.txt 私有仓库认证失败 401 Unauthorized 问题

LLMs-from-scratch（第3章：编码注意力机制）

江西赣建建设监理网站无锡市建设工程质量监督站网站

如何生成逼真的合成表格数据：独立采样与关联建模方法对比

FastGPT 与 MCP 协议概述