当前位置: 首页 > news >正文

008.LangChain 输出解析器

该教程旨在带大家从 0 起步,掌握用 Python 开发大模型应用的技能。若当前内容让你感到晦涩,可回溯本合集的前期文章,降低学习难度。


1. 为什么要学“输出解析器”?

|没有解析器|有了解析器| |-|-| |AI 想回啥就回啥,格式千奇百怪|让 AI 先立规矩再说话| |正则/字符串切割写到崩溃|一行代码直接拿到 Python 对象| |线上崩了才发现格式变了|解析失败就抛异常,提前暴露问题|


2. CommaSeparatedListOutputParser(逗号列表解析器)

2.1. 它到底干啥?

给模型下指令:请用英文逗号 , 把答案分开 • 帮你解析:把 "#ff0000,#00ff00,#0000ff" 直接变成 ['#ff0000','#00ff00','#0000ff']

2.2. 具体实践

2.2.1. 安装
pip install langchain langchain-deepseek
2.2.2. 创建解析器
from langchain.output_parsers import CommaSeparatedListOutputParserparser = CommaSeparatedListOutputParser()
# 打印看看解析器生成的“命令”长啥样
print(parser.get_format_instructions())
# 输出:Your response should be a list of items separated by commas...
2.2.3. 把“命令”塞进提示词
from langchain.prompts import ChatPromptTemplateprompt = ChatPromptTemplate.from_messages([("system", "你是一名色彩设计师。{format_instructions}"),("human", "请给出 5 个符合{theme}主题的背景色十六进制色号"),
])
2.2.4. 调用模型
from langchain_deepseek import ChatDeepSeekllm = ChatDeepSeek(model="deepseek-chat", temperature=0)prompt_with_fmt = prompt.format_prompt(format_instructions=parser.get_format_instructions(),theme="夏季"
)
response = llm.invoke(prompt_with_fmt.to_messages())
colors = parser.parse(response.content)
print(colors)   # ['#87CEEB', '#FFA07A', '#32CD32', '#FFD700', '#FF69B4']

3. PydanticOutputParser(JSON → Python 对象)

3.1. 它到底干啥?

给模型下指令:请按 JSON Schema 输出 • 帮你解析:把 JSON 字符串直接变成 Python 数据类(Pydantic 模型)

3.2. 具体实践

3.2.1. 定义“说明书”
from typing import List
from pydantic import BaseModel, Fieldclass BookInfo(BaseModel):book_name: str  = Field(..., description="书名")book_author: str = Field(..., description="作者")genres: List[str] = Field(..., description="题材列表")
3.2.2. 创建解析器
from langchain.output_parsers import PydanticOutputParserparser = PydanticOutputParser(pydantic_object=BookInfo)
print(parser.get_format_instructions())
# 输出:The JSON should have fields "book_name", "book_author", "genres"...
3.2.3. 塞进提示词
prompt = ChatPromptTemplate.from_messages([("system", "从用户提供的原始文本中提取书籍信息。{format_instructions}"),("human", "{raw_text}"),
])
3.2.4. 调用模型
raw = "《三体》是刘慈欣写的硬核科幻巨作,涉及文明冲突和宇宙社会学。"
book: BookInfo = (prompt | llm | parser).invoke({"raw_text": raw})
print(book.book_name)   # 三体
print(book.book_author) # 刘慈欣
print(book.genres)      # ['科幻', '文明冲突', '宇宙社会学']

如果 AI 把字段拼错或类型不对,Pydantic 会立即抛出 ValidationError,帮你提前发现。


4. LangChain LCEL 管道写法(| 符号到底啥意思?)

4.1. 一句话理解

提示 → 调用模型 → 解析结果 像乐高一样串成一条链,数据从左到右自动流动。

4.2. 从最熟悉的 “函数组合” 开始

# 传统写法
out = func3(func2(func1(data)))# 管道写法
chain = func1 | func2 | func3
out = chain.invoke(data)

在 LangChain 里:

  • func1 是 PromptTemplate

  • func2 是 LLM

  • func3 是 OutputParser

4.3. 优点一览

|场景|传统写法|管道写法| |-|-|-| |加日志|手动包函数|chain = chain.with_listeners(...)| |加缓存|手动写缓存|chain = chain.with_cache()| |并行/批处理|手写循环|chain.batch([...])| |类型提示|弱|全程保持类型安全|

4.4 最小可运行示例

from langchain.prompts import ChatPromptTemplate
from langchain.output_parsers import CommaSeparatedListOutputParser
from langchain_deepseek import ChatDeepSeekparser = CommaSeparatedListOutputParser()
prompt = ChatPromptTemplate.from_messages([("system", "你是一名色彩设计师。{format_instructions}"),("human", "请给出 3 个符合{theme}主题的背景色")
]).partial(format_instructions=parser.get_format_instructions())llm = ChatDeepSeek(model="deepseek-chat", temperature=0)# 一行完成 prompt → llm → parser
chain = prompt | llm | parser
colors = chain.invoke({"theme": "夏日清凉"})
print(colors)   # ['#87CEEB', '#32CD32', '#FFD700']

5. 完整示例代码

5.1. 输出颜色列表

from langchain.prompts import ChatPromptTemplate
from langchain.output_parsers import CommaSeparatedListOutputParser
from langchain_deepseek import ChatDeepSeekdef get_theme_colors_common(theme): # 1. 创建解析器parser = CommaSeparatedListOutputParser()# 2. 构建提示词模版prompt = ChatPromptTemplate.from_messages([("system", "你是一名色彩设计师。{format_instructions}"),("human", "请给出 5 个符合{theme}主题的背景色十六进制色号"),])# 3. 把解析器塞进模版prompt_with_fmt = prompt.format_prompt(format_instructions=parser.get_format_instructions(), theme=theme)llm = ChatDeepSeek(model="deepseek-chat", temperature=0)# 4. 调用模型response = llm.invoke(prompt_with_fmt.to_messages())return parser.parse(response.content)def get_theme_colors_pipeline(theme):# 1. 创建解析器parser = CommaSeparatedListOutputParser()# 2. 构建提示词模版prompt = ChatPromptTemplate.from_messages([("system", "你是一名色彩设计师。{format_instructions}"),("human", "请给出 5 个符合{theme}主题的背景色十六进制色号"),])# 3. 把解析器塞进模版prompt_with_fmt = prompt.partial(format_instructions=parser.get_format_instructions())llm = ChatDeepSeek(model="deepseek-chat", temperature=0)# 4. 调用模型chain = prompt_with_fmt | llm | parserreturn chain.invoke({"theme": theme})if __name__ == "__main__":common_colors = get_theme_colors_common("夏季")pipeline_colors = get_theme_colors_pipeline("夏季")print(common_colors)print(pipeline_colors)

5.2. 解析书籍信息

from typing import List
from pydantic import BaseModel, Field
from langchain.output_parsers import PydanticOutputParser
from langchain_deepseek import ChatDeepSeek
from langchain.prompts import ChatPromptTemplateclass BookInfo(BaseModel):book_name: str = Field(..., description="书名")book_author: str = Field(..., description="作者")genres: List[str] = Field(..., description="题材列表")parser = PydanticOutputParser(pydantic_object=BookInfo)prompt = ChatPromptTemplate.from_messages([("system", "从用户提供的原始文本中提取书籍信息。{format_instructions}"),("human", "{raw_text}"),
])prompt_with_fmt = prompt.partial(format_instructions=parser.get_format_instructions())llm = ChatDeepSeek(model="deepseek-chat", temperature=0)raw = "《三体》是刘慈欣写的硬核科幻巨作,涉及文明冲突和宇宙社会学。"book: BookInfo = (prompt_with_fmt | llm | parser).invoke({"raw_text": raw})print(book.book_name)
print(book.book_author)
print(book.genres)
http://www.dtcms.com/a/359799.html

相关文章:

  • 备份压缩存储优化方案:提升效率与节省空间的完整指南
  • 新手首次操作SEO核心要点
  • 线程池常见面试问答
  • 【Java实战⑩】Java 集合框架实战:Set与Map的奇妙之旅
  • 基于三维反投影矫正拼接视频
  • 数据结构(04)—— 栈和队列
  • 使用node-red+opencv+mqtt实现相机图像云端查看
  • 零基础入门AutoSar中的ARXML文件
  • Dify 从入门到精通(第 67/100 篇):Dify 的高可用性部署(进阶篇)
  • 从零开始写个deer-flow-mvp-第一天
  • 【C++】类和对象(一)
  • 【全功能图片处理工具详解】基于Streamlit的现代化图像处理解决方案
  • 二.Shell脚本编程
  • 微软开源TTS模型VibeVoice,可生成 90 分钟4人语音
  • 李宏毅NLP-13-Vocoder
  • 中级统计师-统计实务-第四章 专业统计
  • FPGA入门指南:从零开始的可编程逻辑世界探索
  • 【Proteus仿真】点亮小灯系列仿真——小灯闪烁/流水灯/交通灯
  • 常用的20个c++函数
  • 11.1.5 实现文件删除,共享和共享下载排行榜
  • 【GaussDB】排查应用高可用切换出现数据库整体卡顿及报错自治事务无法创建的问题
  • Photoshop - Ps 裁剪并拉直图片
  • 【C++详解】C++11(二) lambda表达式、类型分类、引⽤折叠、完美转发
  • 计算机视觉(四):二值化
  • 如何重置SVN被保存的用户名和密码
  • 基于路测点云标注生成OpenDrive地图的全流程解析
  • TI-92 Plus计算器:函数图像功能介绍
  • ros2bag_py的api小结、丢帧问题对策
  • 第四十九天(springboot模版注入ThymeleafFreemarkerVelocity)
  • 飞牛NAS上部署Markdown文稿编辑器,阅读.md文件同时还可以跨平台访问!