当前位置: 首页 > news >正文

零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路

大家好,我是工藤学编程 🦉一个正在努力学习的小博主,期待你的关注
实战代码系列最新文章😉C++实现图书管理系统(Qt C++ GUI界面版)
SpringBoot实战系列🐷【SpringBoot实战系列】SpringBoot3.X 整合 MinIO 存储原生方案
分库分表分库分表之实战-sharding-JDBC分库分表执行流程原理剖析
消息队列深入浅出 RabbitMQ-RabbitMQ消息确认机制(ACK)
AI大模型零基础学AI大模型之LangChain

前情摘要:
1、零基础学AI大模型之读懂AI大模型
2、零基础学AI大模型之从0到1调用大模型API
3、零基础学AI大模型之SpringAI
4、零基础学AI大模型之AI大模型常见概念
5、零基础学AI大模型之大模型私有化部署全指南
6、零基础学AI大模型之AI大模型可视化界面
7、零基础学AI大模型之LangChain


本文章目录

  • 零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路
    • 一、先明确:为什么要懂模块和IO链路?
    • 二、LangChain模块 vs Java Spring生态
    • 三、LangChain六大核心模块
      • 1. Models(模型层)
      • 2. Prompts(提示工程)
      • 3. Chains(任务链)
      • 4. Memory(记忆)
      • 5. Indexes(索引)
      • 6. Agents(智能体)
    • 四、LangChain大模型IO交互链路
      • 链路分步拆解:
    • 五、零基础总结:六大模块的“核心用法口诀”

零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路

在前一篇文章中,我们认识了LangChain的生态全景,知道它能帮我们连接大模型与工具、快速开发智能应用。但对于零基础开发者来说,想真正上手,还得先搞懂它的“内部构造”——也就是LangChain的核心模块,以及这些模块如何配合大模型完成一次完整的交互(IO链路)。

今天这篇,我们就从“模块拆解”和“链路梳理”两个维度,用你熟悉的Java生态做类比,把LangChain的核心逻辑讲透。毕竟,搞懂“零件”和“工作流程”,后续搭应用才会得心应手。

在这里插入图片描述

一、先明确:为什么要懂模块和IO链路?

在学Spring时,你会先懂IOC容器、Bean、AOP这些核心概念,再学怎么搭项目——LangChain也一样。搞懂模块和链路,能解决两个关键问题:

  1. “知道用什么”:比如需要“保存对话历史”,就知道该用Memory模块;需要“对接DeepSeek和GPT”,就知道用Models模块;
  2. “知道怎么查问题”:比如AI没返回预期结果,能顺着IO链路排查——是Prompt写得不好?还是Chain步骤漏了?或是Memory没生效?

二、LangChain模块 vs Java Spring生态

对零基础来说,“类比已知技术”是最快的理解方式。LangChain的每个核心模块,都能在Spring生态里找到对应的“影子”,我们用表格直接对标,降低理解门槛:

LangChain核心模块核心作用Java Spring生态类比零基础理解关键点
Models(模型层)统一对接不同大模型(OpenAI/Gemini/DeepSeek)JDBC接口(对接不同数据库)不用记不同大模型的API格式,用Models模块就能“一键切换”
Prompts(提示工程)管理Prompt模板,动态填充参数Thymeleaf(模板引擎)像写HTML模板一样写Prompt,比如用{concept}占位,后续填充内容
Chains(任务链)串联多个组件(如Models+Prompts),执行连贯任务Activiti BPMN(工作流引擎)把“查天气→生成建议”拆成两步,用Chain自动执行,不用手动写衔接逻辑
Memory(记忆)保存对话历史或任务状态HTTP Session(会话管理)就像登录后Session记住你的用户名,Memory记住你之前和AI说过的话
Indexes(索引)加载/处理外部数据(文档/网页/数据库),供LLM使用JDBC+数据库索引把网页内容、Excel文档“读”进来,整理成LLM能理解的格式,像JDBC读数据库数据
Agents(智能体)自主决策调用哪个工具/Chain,处理复杂需求策略模式+Drools规则引擎比如用户问“算1+1再解释结果”,Agents会自己决定“先调用计算器工具,再用LLM解释”

三、LangChain六大核心模块

接下来,我们逐个拆解六大模块,每个模块都包含“核心定位+通俗解释+Java类比+代码示例”,你可以直接复制代码跑一跑(前提是已安装LangChain,参考上一篇的安装步骤)。

1. Models(模型层)

核心定位:定义大模型的“通用接口”,屏蔽不同厂商API的差异。
通俗解释:就像JDBC接口,不管你用MySQL还是Oracle,都用ConnectionStatement操作;Models模块不管你用OpenAI还是DeepSeek,都用统一的LLM类调用。

代码示例(对接DeepSeek)

# 导入Models模块的DeepSeek封装
from langchain_community.llms import DeepSeek# 初始化大模型(类似JDBC的Class.forName()加载驱动)
llm = DeepSeek(model="deepseek-chat",  # 模型名称(不同大模型这里改名字即可)api_key="你的DeepSeek API Key"  # 替换成你的API Key
)# 调用模型(统一接口,换OpenAI也这么写)
result = llm.invoke("用一句话解释什么是Java的接口?")
print(result)
# 输出示例:Java的接口是一种抽象类型,定义了类应实现的方法规范,就像一份“契约”,只规定做什么,不规定怎么做。

2. Prompts(提示工程)

核心定位:管理Prompt模板,支持动态传参,避免重复写Prompt。
通俗解释:就像Thymeleaf写Hello, ${name}!${name}是占位符;Prompts模块用{变量名}做占位符,后续动态填充内容。

代码示例(生成Java概念解释)

from langchain.prompts import PromptTemplate# 1. 定义Prompt模板(类似Thymeleaf的HTML模板)
template = """
你是一个Java专家,请用比喻解释{concept}:
要求:
1. 用{framework}框架做类比
2. 不超过2句话
"""
# 2. 初始化模板(解析占位符)
prompt = PromptTemplate.from_template(template)# 3. 动态填充参数(类似Thymeleaf渲染时传值)
filled_prompt = prompt.format(concept="多线程",  # 要解释的Java概念framework="Spring Batch"  # 用来类比的框架
)print(filled_prompt)
# 输出示例:
# 你是一个Java专家,请用比喻解释多线程:
# 要求:
# 1. 用Spring Batch框架做类比
# 2. 不超过2句话# 4. 结合Models模块调用(后续会用Chain自动串联这步)
result = llm.invoke(filled_prompt)
print(result)
# 输出示例:Java多线程像Spring Batch的并行任务,能同时处理多个任务提升效率,就像Spring Batch用多线程处理批量数据一样。

3. Chains(任务链)

核心定位:串联多个组件(如Models+Prompts),自动执行多步任务,避免手动衔接。
通俗解释:就像Spring Batch的“读→处理→写”流程,Chain把“填充Prompt→调用Models→返回结果”串成一个流程,你只需要调用run()即可。

代码示例(串联Prompts+Models)

from langchain.chains import LLMChain# 1. 复用前面的llm(Models)和prompt(Prompts)
# 2. 创建Chain(串联两个组件,类似Spring Batch定义Step流程)
chain = LLMChain(llm=llm, prompt=prompt)# 3. 执行Chain(一步到位,不用手动填充Prompt再调用Models)
result = chain.run(concept="Spring IOC", framework="JDBC"
)print(result)
# 输出示例:Spring IOC像JDBC的连接池,IOC容器管理Bean的创建和依赖注入,就像连接池管理数据库连接,不用手动创建。

4. Memory(记忆)

核心定位:保存对话历史,让AI能“记住”之前的交互内容。
通俗解释:就像HTTP Session保存用户登录状态,Memory保存你和AI的对话,比如你先问“我叫小明”,后续AI能在回答中提到“小明”。

代码示例(保存对话历史)

from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory# 1. 初始化Memory(类似创建Session)
memory = ConversationBufferMemory()# 2. 创建对话Chain(集成Memory)
conversation_chain = ConversationChain(llm=llm,memory=memory,  # 给Chain加“记忆”verbose=True  # 打印对话历史(方便调试)
)# 3. 第一次交互
conversation_chain.predict(input="你好,我叫小明,是Java初学者。")
# 输出示例:您好小明!作为Java初学者,建议先从基础语法(如变量、循环)和面向对象概念(类、对象)入手,后续再学Spring等框架~# 4. 第二次交互(AI会记住“小明”和“Java初学者”)
result = conversation_chain.predict(input="我该怎么学Spring?")
print(result)
# 输出示例:小明,作为Java初学者,学Spring可以先从Spring Core(IOC、DI)开始,理解Bean的管理逻辑,再结合简单案例练手,比如用Spring做一个简单的用户查询功能,逐步过渡到Spring Boot~

5. Indexes(索引)

核心定位:加载、处理外部数据(网页/文档/数据库),把数据整理成LLM能理解的格式。
通俗解释:就像JDBC连接数据库并查询数据,Indexes模块连接外部数据源(比如Spring官网文档),把内容“读”进来,再切割、整理,供LLM后续分析。

代码示例(加载Spring官网文档)

from langchain.document_loaders import WebBaseLoader
from langchain.text_splitter import CharacterTextSplitter# 1. 加载外部数据(类似JDBC连接数据库)
# 这里加载Spring Boot官网文档的某个页面
loader = WebBaseLoader("https://docs.spring.io/spring-boot/docs/current/reference/htmlsingle/#getting-started")
docs = loader.load()  # 读取页面内容# 2. 处理数据:切割长文本(LLM有 token 限制,太长的内容要拆)
text_splitter = CharacterTextSplitter(chunk_size=500,  # 每个片段500字符chunk_overlap=50  # 片段间重叠50字符(避免上下文断裂)
)
split_docs = text_splitter.split_documents(docs)# 3. 查看处理后的数据(后续可结合Models模块,让LLM分析这些文档)
print(f"总共拆成{len(split_docs)}个片段")
print("第一个片段内容:", split_docs[0].page_content[:200])  # 打印前200字符
# 输出示例:总共拆成12个片段;第一个片段内容:Getting Started
# 1.1. What You Will Build
# You will build a simple web application with Spring Boot and add some useful services to it.

6. Agents(智能体)

核心定位:自主决策“调用哪个工具/Chain”,比Chain更灵活,能处理需要判断的复杂需求。
通俗解释:就像策略模式——遇到“计算”需求就调用计算器工具,遇到“解释概念”就调用LLM;Agents会根据用户问题,自己选对应的处理方式。

代码示例(调用计算器工具)

from langchain.agents import Tool, initialize_agent
from langchain.chains import LLMMathChain  # 计算器工具# 1. 初始化工具(类似Spring中定义Bean)
# 工具1:计算器(处理数学计算)
math_chain = LLMMathChain.from_llm(llm=llm)
tools = [Tool(name="Calculator",  # 工具名称(Agents会用这个名字调用)func=math_chain.run,  # 工具对应的函数description="用来计算数学表达式,比如1+1、(3*4)/2等"  # 工具描述(Agents靠这个判断要不要用))
]# 2. 初始化Agents(设置决策逻辑)
agent = initialize_agent(tools=tools,llm=llm,agent="zero-shot-react-description",  # 决策模式:根据工具描述判断是否调用verbose=True  # 打印思考过程(方便看Agents怎么决策)
)# 3. 执行复杂任务(Agents会自己判断要不要调用工具)
result = agent.run("请计算:Java中int类型占4个字节,一个int数组有10个元素,这个数组总共占多少字节?")
print(result)
# 思考过程示例:我需要计算数组总字节数,int占4字节,10个元素就是4*10,应该调用Calculator工具;
# 输出示例:Java中int类型占4个字节,10个元素的int数组总字节数为4*10=40字节,因此该数组总共占40字节。

四、LangChain大模型IO交互链路

懂了单个模块,还要知道它们怎么配合工作。我们结合“用户问‘查Spring Boot文档,解释什么是自动配置’”这个需求,拆解IO交互链路(对应之前提到的分层设计):

在这里插入图片描述

链路分步拆解:

  1. 应用层(Agents):决策“要做什么”
    接收用户输入“查Spring Boot文档,解释什么是自动配置”,Agents分析后决定:需要先“用Indexes加载文档”,再“用Chain串联‘文档内容→LLM解释’”。

  2. 编排层(Chains):规划“怎么做”
    Chains把任务拆成两步:
    第一步:调用Indexes模块加载Spring Boot文档中“自动配置”相关内容;
    第二步:把加载的内容传给Prompts模板,再调用Models模块生成解释。

  3. 能力层(Indexes):获取“外部数据”
    Indexes模块加载Spring Boot官网文档,切割出“自动配置”相关的文本片段,传给Chains。

  4. 模型层(Models):生成“核心结果”
    Models模块(如DeepSeek)接收Chains传来的“文档片段+Prompt模板”,生成对“自动配置”的通俗解释。

  5. 数据层(Memory):补充“历史信息”
    如果之前用户问过“什么是Spring Boot”,Memory会把这段历史传给Models,让解释更连贯(比如提到“延续之前说的Spring Boot简化配置的特点,自动配置进一步减少手动配置”)。

  6. 输出结果:把Models生成的解释返回给用户,完成一次IO交互。

五、零基础总结:六大模块的“核心用法口诀”

为了方便你记忆,总结一个零基础能看懂的“用法口诀”:

  • Models :对接大模型,换模型只改参数;
  • Prompts :写Prompt模板,动态传参不重复;
  • Chains :串组件成流程,多步任务自动跑;
  • Memory:存对话历史,上下文连贯不健忘;
  • Indexes:读外部数据,文档网页都能拿;
  • Agents:做决策选工具,复杂需求不用愁。

喜欢请点赞收藏。如果有想看的内容,也可以在评论区告诉我~

http://www.dtcms.com/a/414265.html

相关文章:

  • 20250927让荣品RD-RK3588-MID开发板的Android13系统在uboot下关闭背光充电
  • 人工智能专业知识图谱
  • 深入理解Windows服务:架构、管理与编程实践
  • 作风建设简报--门户网站如何提高网站百度权重
  • CentOS7搭建ELK日志分析系统
  • 基于大数据hive的银行信用卡用户的数仓系统的设计与实现_django
  • Docker从网络管理到容器优化
  • count down 83 days
  • 华为云速建站如何用网页设计制作个人网站
  • 做网站用什么压缩代码和图片如何做淘宝商城网站
  • 基于STM32与influxDB的电力监控系统-3
  • STM32 程序下载失败的问题原因和解决方法集合!
  • 【读论文】AI笔记(一)9月26日组会前
  • 逻辑的回归——一阶谓词逻辑及其变体在自然语言处理深层语义分析中的作用与前瞻
  • Java EE初阶启程记03---Thread类及常见方法
  • 医疗行业 AI 投毒攻击原理及防护研究
  • PostIn入门到实战(5) - 如何快速导入PostMan数据,实现数据迁移
  • 让别人做网站需要注意什么服务器试用
  • 京东JoyAgent-JDGenie开源多智能体系统如何重塑AI应用落地新范式
  • idea学习日记7: StringBuilder的基本操作
  • MySQL专用服务器自动调优指南
  • Ubuntu24.04 安卓模拟器安装指南
  • 做餐饮网站价格网站建设内部优化
  • AI大模型开发语言排行
  • UMI企业智脑知识与数据管理:企业的智慧宝库
  • B3611 【模板】传递闭包-普及/提高-
  • 网上帮别人做网站深圳网站营销公司
  • 国内完美安装 Rust 环境 + VSCode 编写 Hello World 完整指南(2025 最新)
  • 基于 HTML、CSS 和 JavaScript 的智能图像灰度直方图匹配系统
  • 【自然语言处理与大模型】LlamaIndex快速入门①