当前位置：首页 > news >正文

零基础langchain实战二：大模型输出格式化成json

news 来源：原创 2025/6/29 11:04:18

零基础langchain实战一：模型、提示词和解析器-CSDN博客

书接上文

大模型输出格式化

在下面例子中：我们需要将大模型的输出格式化成json。

import os
from dotenv import load_dotenvload_dotenv()  # 加载 .env 文件
api_key = os.getenv("DEEPSEEK_API_KEY")from langchain_openai import ChatOpenAI
llm = ChatOpenAI(model="deepseek-chat",temperature=0.0,max_tokens=None,timeout=None,max_retries=2,base_url="https://api.deepseek.com",api_key=api_key,
)

调用ResponseSchema定义输出格式json：

最后生成的json格式为：

from langchain.output_parsers import ResponseSchema
from langchain.output_parsers import StructuredOutputParseraffection_schema = ResponseSchema(name="affection", description="评价这段话总体的情感是积极的还是消极的，并为其打分，输出为-1.0 至 1.0 的一位小数")
positive_content_schema = ResponseSchema(name="positive", description="总结这段话评价了物品的哪些优点，列举出物品的优点。如果没有输出 None")
negative_content_schema = ResponseSchema(name="negative", description="总结这段话评价了物品的哪些缺点，列举出物品的缺点。如果没有输出 None")response_schema = [affection_schema, positive_content_schema, negative_content_schema]

因此实例化三个ResponseSchema，一个相当于json中的一个key。

并将三个实例添加到列表中。

output_parser = StructuredOutputParser.from_response_schemas(response_schema)
format_instructions = output_parser.get_format_instructions()

StructuredOutputParser：创建一个结构化输出解析器，用于将 LLM 的文本输出解析为预定义的结构化格式。

format instructions：生成 格式化指令，这些指令会直接插入到提示模板中，指导 LLM 如何按结构化格式输出结果。

按照之前的方法定义system_prompt：

from langchain.prompts import ChatPromptTemplateprompt = """下面这段话是用户评价商品的一段话 \请你帮忙判断这段话总体来说为“好评”还是“差评” \告诉我用户为物品的哪些特征打“好评” \哪些特征打差评text：{comment}{format_instructions}
"""prompt_template = ChatPromptTemplate.from_template(prompt)prompt_template.messages[0].prompt

comment = """尺码正常买就行，不用买太大。 \鞋底非常高～鞋楦较宽，高脚背胖脚也能穿。 \鞋底非常软弹，很容易踩开，确实超出预期。 \鞋子非常轻，真的很轻哈哈哈～差不多和竞训碳板鞋一样轻了[爱心_blue][爱心_blue]。 \因为是防泼水鞋面嘛，所以鞋面有点不透气，室外温度30度穿这鞋会有点热，可以秋天再入手。 \补充一下哈，因为是全黑的鞋，所以刚开始看起来会有点怪怪的，时间长了就更耐看了 """

messages = prompt_template.format_messages(comment = comment,format_instructions = format_instructions)print(messages[0].content)

输出如下：

调用大模型：

response = llm.invoke(messages)
print(response.content)

输出如下：

最后调用先前的 结构化输出解析器 将大模型输出结果解析成json格式：

output_dict = output_parser.parse(response.content)

最后的结果为：

总结：

LangChain 中的 Output Parser（输出解析器） 和 Prompt Template（提示模板） 相当于在调用大模型的输入前和输出后添加了两个中间层，它们共同作用，确保大模型的输出符合预定义的格式规范。这种设计的核心目标是让大模型的输出更结构化、可解析、可验证，从而满足实际应用的需求。

Q&A：