当前位置：首页 > news >正文

零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路

news 2025/9/28 5:24:17

大家好，我是工藤学编程 🦉	一个正在努力学习的小博主，期待你的关注
实战代码系列最新文章😉	C++实现图书管理系统（Qt C++ GUI界面版）
SpringBoot实战系列🐷	【SpringBoot实战系列】SpringBoot3.X 整合 MinIO 存储原生方案
分库分表	分库分表之实战-sharding-JDBC分库分表执行流程原理剖析
消息队列	深入浅出 RabbitMQ-RabbitMQ消息确认机制（ACK）
AI大模型	零基础学AI大模型之LangChain

前情摘要：
1、零基础学AI大模型之读懂AI大模型
2、零基础学AI大模型之从0到1调用大模型API
3、零基础学AI大模型之SpringAI
4、零基础学AI大模型之AI大模型常见概念
5、零基础学AI大模型之大模型私有化部署全指南
6、零基础学AI大模型之AI大模型可视化界面
7、零基础学AI大模型之LangChain

本文章目录

零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路
- 一、先明确：为什么要懂模块和IO链路？
- 二、LangChain模块 vs Java Spring生态
- 三、LangChain六大核心模块
- - 1. Models（模型层）
  - 2. Prompts（提示工程）
  - 3. Chains（任务链）
  - 4. Memory（记忆）
  - 5. Indexes（索引）
  - 6. Agents（智能体）
- 四、LangChain大模型IO交互链路
- - 链路分步拆解：
- 五、零基础总结：六大模块的“核心用法口诀”

零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路

在前一篇文章中，我们认识了LangChain的生态全景，知道它能帮我们连接大模型与工具、快速开发智能应用。但对于零基础开发者来说，想真正上手，还得先搞懂它的“内部构造”——也就是LangChain的核心模块，以及这些模块如何配合大模型完成一次完整的交互（IO链路）。

今天这篇，我们就从“模块拆解”和“链路梳理”两个维度，用你熟悉的Java生态做类比，把LangChain的核心逻辑讲透。毕竟，搞懂“零件”和“工作流程”，后续搭应用才会得心应手。

在这里插入图片描述

一、先明确：为什么要懂模块和IO链路？

在学Spring时，你会先懂IOC容器、Bean、AOP这些核心概念，再学怎么搭项目——LangChain也一样。搞懂模块和链路，能解决两个关键问题：

“知道用什么”：比如需要“保存对话历史”，就知道该用Memory模块；需要“对接DeepSeek和GPT”，就知道用Models模块；
“知道怎么查问题”：比如AI没返回预期结果，能顺着IO链路排查——是Prompt写得不好？还是Chain步骤漏了？或是Memory没生效？

二、LangChain模块 vs Java Spring生态

对零基础来说，“类比已知技术”是最快的理解方式。LangChain的每个核心模块，都能在Spring生态里找到对应的“影子”，我们用表格直接对标，降低理解门槛：

LangChain核心模块	核心作用	Java Spring生态类比	零基础理解关键点
Models（模型层）	统一对接不同大模型（OpenAI/Gemini/DeepSeek）	JDBC接口（对接不同数据库）	不用记不同大模型的API格式，用Models模块就能“一键切换”
Prompts（提示工程）	管理Prompt模板，动态填充参数	Thymeleaf（模板引擎）	像写HTML模板一样写Prompt，比如用`{concept}`占位，后续填充内容
Chains（任务链）	串联多个组件（如Models+Prompts），执行连贯任务	Activiti BPMN（工作流引擎）	把“查天气→生成建议”拆成两步，用Chain自动执行，不用手动写衔接逻辑
Memory（记忆）	保存对话历史或任务状态	HTTP Session（会话管理）	就像登录后Session记住你的用户名，Memory记住你之前和AI说过的话
Indexes（索引）	加载/处理外部数据（文档/网页/数据库），供LLM使用	JDBC+数据库索引	把网页内容、Excel文档“读”进来，整理成LLM能理解的格式，像JDBC读数据库数据
Agents（智能体）	自主决策调用哪个工具/Chain，处理复杂需求	策略模式+Drools规则引擎	比如用户问“算1+1再解释结果”，Agents会自己决定“先调用计算器工具，再用LLM解释”

三、LangChain六大核心模块

接下来，我们逐个拆解六大模块，每个模块都包含“核心定位+通俗解释+Java类比+代码示例”，你可以直接复制代码跑一跑（前提是已安装LangChain，参考上一篇的安装步骤）。

1. Models（模型层）

核心定位：定义大模型的“通用接口”，屏蔽不同厂商API的差异。
通俗解释：就像JDBC接口，不管你用MySQL还是Oracle，都用Connection、Statement操作；Models模块不管你用OpenAI还是DeepSeek，都用统一的LLM类调用。

代码示例（对接DeepSeek）：

# 导入Models模块的DeepSeek封装
from langchain_community.llms import DeepSeek# 初始化大模型（类似JDBC的Class.forName()加载驱动）
llm = DeepSeek(model="deepseek-chat",  # 模型名称（不同大模型这里改名字即可）api_key="你的DeepSeek API Key"  # 替换成你的API Key
)# 调用模型（统一接口，换OpenAI也这么写）
result = llm.invoke("用一句话解释什么是Java的接口？")
print(result)
# 输出示例：Java的接口是一种抽象类型，定义了类应实现的方法规范，就像一份“契约”，只规定做什么，不规定怎么做。

2. Prompts（提示工程）

核心定位：管理Prompt模板，支持动态传参，避免重复写Prompt。
通俗解释：就像Thymeleaf写Hello, ${name}!，${name}是占位符；Prompts模块用{变量名}做占位符，后续动态填充内容。

代码示例（生成Java概念解释）：

from langchain.prompts import PromptTemplate# 1. 定义Prompt模板（类似Thymeleaf的HTML模板）
template = """
你是一个Java专家，请用比喻解释{concept}：
要求：
1. 用{framework}框架做类比
2. 不超过2句话
"""
# 2. 初始化模板（解析占位符）
prompt = PromptTemplate.from_template(template)# 3. 动态填充参数（类似Thymeleaf渲染时传值）
filled_prompt = prompt.format(concept="多线程",  # 要解释的Java概念framework="Spring Batch"  # 用来类比的框架
)print(filled_prompt)
# 输出示例：
# 你是一个Java专家，请用比喻解释多线程：
# 要求：
# 1. 用Spring Batch框架做类比
# 2. 不超过2句话# 4. 结合Models模块调用（后续会用Chain自动串联这步）
result = llm.invoke(filled_prompt)
print(result)
# 输出示例：Java多线程像Spring Batch的并行任务，能同时处理多个任务提升效率，就像Spring Batch用多线程处理批量数据一样。

3. Chains（任务链）

核心定位：串联多个组件（如Models+Prompts），自动执行多步任务，避免手动衔接。
通俗解释：就像Spring Batch的“读→处理→写”流程，Chain把“填充Prompt→调用Models→返回结果”串成一个流程，你只需要调用run()即可。

代码示例（串联Prompts+Models）：

from langchain.chains import LLMChain# 1. 复用前面的llm（Models）和prompt（Prompts）
# 2. 创建Chain（串联两个组件，类似Spring Batch定义Step流程）
chain = LLMChain(llm=llm, prompt=prompt)# 3. 执行Chain（一步到位，不用手动填充Prompt再调用Models）
result = chain.run(concept="Spring IOC", framework="JDBC"
)print(result)
# 输出示例：Spring IOC像JDBC的连接池，IOC容器管理Bean的创建和依赖注入，就像连接池管理数据库连接，不用手动创建。

4. Memory（记忆）

核心定位：保存对话历史，让AI能“记住”之前的交互内容。
通俗解释：就像HTTP Session保存用户登录状态，Memory保存你和AI的对话，比如你先问“我叫小明”，后续AI能在回答中提到“小明”。

代码示例（保存对话历史）：

from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory# 1. 初始化Memory（类似创建Session）
memory = ConversationBufferMemory()# 2. 创建对话Chain（集成Memory）
conversation_chain = ConversationChain(llm=llm,memory=memory,  # 给Chain加“记忆”verbose=True  # 打印对话历史（方便调试）
)# 3. 第一次交互
conversation_chain.predict(input="你好，我叫小明，是Java初学者。")
# 输出示例：您好小明！作为Java初学者，建议先从基础语法（如变量、循环）和面向对象概念（类、对象）入手，后续再学Spring等框架~# 4. 第二次交互（AI会记住“小明”和“Java初学者”）
result = conversation_chain.predict(input="我该怎么学Spring？")
print(result)
# 输出示例：小明，作为Java初学者，学Spring可以先从Spring Core（IOC、DI）开始，理解Bean的管理逻辑，再结合简单案例练手，比如用Spring做一个简单的用户查询功能，逐步过渡到Spring Boot~

5. Indexes（索引）

核心定位：加载、处理外部数据（网页/文档/数据库），把数据整理成LLM能理解的格式。
通俗解释：就像JDBC连接数据库并查询数据，Indexes模块连接外部数据源（比如Spring官网文档），把内容“读”进来，再切割、整理，供LLM后续分析。

代码示例（加载Spring官网文档）：

from langchain.document_loaders import WebBaseLoader
from langchain.text_splitter import CharacterTextSplitter# 1. 加载外部数据（类似JDBC连接数据库）
# 这里加载Spring Boot官网文档的某个页面
loader = WebBaseLoader("https://docs.spring.io/spring-boot/docs/current/reference/htmlsingle/#getting-started")
docs = loader.load()  # 读取页面内容# 2. 处理数据：切割长文本（LLM有 token 限制，太长的内容要拆）
text_splitter = CharacterTextSplitter(chunk_size=500,  # 每个片段500字符chunk_overlap=50  # 片段间重叠50字符（避免上下文断裂）
)
split_docs = text_splitter.split_documents(docs)# 3. 查看处理后的数据（后续可结合Models模块，让LLM分析这些文档）
print(f"总共拆成{len(split_docs)}个片段")
print("第一个片段内容：", split_docs[0].page_content[:200])  # 打印前200字符
# 输出示例：总共拆成12个片段；第一个片段内容：Getting Started
# 1.1. What You Will Build
# You will build a simple web application with Spring Boot and add some useful services to it.

6. Agents（智能体）

核心定位：自主决策“调用哪个工具/Chain”，比Chain更灵活，能处理需要判断的复杂需求。
通俗解释：就像策略模式——遇到“计算”需求就调用计算器工具，遇到“解释概念”就调用LLM；Agents会根据用户问题，自己选对应的处理方式。

代码示例（调用计算器工具）：

from langchain.agents import Tool, initialize_agent
from langchain.chains import LLMMathChain  # 计算器工具# 1. 初始化工具（类似Spring中定义Bean）
# 工具1：计算器（处理数学计算）
math_chain = LLMMathChain.from_llm(llm=llm)
tools = [Tool(name="Calculator",  # 工具名称（Agents会用这个名字调用）func=math_chain.run,  # 工具对应的函数description="用来计算数学表达式，比如1+1、(3*4)/2等"  # 工具描述（Agents靠这个判断要不要用）)
]# 2. 初始化Agents（设置决策逻辑）
agent = initialize_agent(tools=tools,llm=llm,agent="zero-shot-react-description",  # 决策模式：根据工具描述判断是否调用verbose=True  # 打印思考过程（方便看Agents怎么决策）
)# 3. 执行复杂任务（Agents会自己判断要不要调用工具）
result = agent.run("请计算：Java中int类型占4个字节，一个int数组有10个元素，这个数组总共占多少字节？")
print(result)
# 思考过程示例：我需要计算数组总字节数，int占4字节，10个元素就是4*10，应该调用Calculator工具；
# 输出示例：Java中int类型占4个字节，10个元素的int数组总字节数为4*10=40字节，因此该数组总共占40字节。

四、LangChain大模型IO交互链路

懂了单个模块，还要知道它们怎么配合工作。我们结合“用户问‘查Spring Boot文档，解释什么是自动配置’”这个需求，拆解IO交互链路（对应之前提到的分层设计）：

在这里插入图片描述

链路分步拆解：

应用层（Agents）：决策“要做什么”
接收用户输入“查Spring Boot文档，解释什么是自动配置”，Agents分析后决定：需要先“用Indexes加载文档”，再“用Chain串联‘文档内容→LLM解释’”。
编排层（Chains）：规划“怎么做”
Chains把任务拆成两步：
第一步：调用Indexes模块加载Spring Boot文档中“自动配置”相关内容；
第二步：把加载的内容传给Prompts模板，再调用Models模块生成解释。
能力层（Indexes）：获取“外部数据”
Indexes模块加载Spring Boot官网文档，切割出“自动配置”相关的文本片段，传给Chains。
模型层（Models）：生成“核心结果”
Models模块（如DeepSeek）接收Chains传来的“文档片段+Prompt模板”，生成对“自动配置”的通俗解释。
数据层（Memory）：补充“历史信息”
如果之前用户问过“什么是Spring Boot”，Memory会把这段历史传给Models，让解释更连贯（比如提到“延续之前说的Spring Boot简化配置的特点，自动配置进一步减少手动配置”）。
输出结果：把Models生成的解释返回给用户，完成一次IO交互。