当前位置：首页 > news >正文

LangChain4j实战

news 2025/10/20 21:35:49

一、什么是 LangChain4j？

目前主流的 Java AI 开发框架有 Spring AI 和 LangChain4j，它们都提供了很多开箱即用的 API 来帮你调用大模型、实现 AI 开发常用的功能，上期我们学了SpringAi，今天我们要学的是：

对话记忆
结构化输出
RAG 知识库
工具调用
MCP
SSE 流式输出

二、开始实操

1、新建项目

打开 IDEA 开发工具，新建一个 Spring Boot 项目，Java 版本尽量选择 21（因为 LangChain4j 最低支持 17 版本）：
在这里插入图片描述
选择依赖，使用 3.5.x 版本的 Spring Boot，引入 Spring MVC 和 Lombok 注解库：

2、AI 对话 - ChatModel

ChatModel 是最基础的概念，负责和 AI 大模型交互。

首先需要引入至少一个 AI 大模型依赖，这里选择国内的阿里云大模型，提供了和 Spring Boot 项目的整合依赖包，比较方便：

<dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j-community-dashscope-spring-boot-starter</artifactId><version>1.1.0-beta7</version>
</dependency>

需要到阿里云百炼平台获取大模型调用 key，注意不要泄露！
在这里插入图片描述
回到项目，在配置文件中添加大模型配置，指定模型名称和 API Key：

langchain4j:community:dashscope:chat-model:model-name: qwen-maxapi-key: <You API Key here>

有了 ChatModel 后，创建一个 AiCodeHelper 类，引入自动注入的 qwenChatModel，编写简单的对话代码，并利用 Lombok 注解打印输出结果日志：

@Service
@Slf4j
publicclass AiCodeHelper {@Resourceprivate ChatModel qwenChatModel;public String chat(String message) {UserMessage userMessage = UserMessage.from(message);ChatResponse chatResponse = qwenChatModel.chat(userMessage);AiMessage aiMessage = chatResponse.aiMessage();log.info("AI 输出：" + aiMessage.toString());return aiMessage.text();}
}

编写单元测试【在chat方法中按alt+回车】

@SpringBootTest
class AiCodeHelperApplicationTests {@Resourcepublic AiCodeHelper aiCodeHelper;@Testvoid chat() {String chat = aiCodeHelper.chat("你好,我是程序员鱼亮");System.out.println(chat);}
}

以 Debug 模式运行单元测试，成功运行并查看输出：
在这里插入图片描述

3、多模态【候补】

多模态是指能够同时处理、理解和生成多种不同类型数据的能力，比如文本、图像、音频、视频、PDF 等等。
LangChain4j 中使用多模态的方法很简单，用户消息中是可以添加图片、音视频、PDF 等媒体资源的。

4、系统提示词 - SystemMessage

系统提示词是设置 AI 模型行为规则和角色定位的隐藏指令，用户通常不能直接看到。系统 Prompt 相当于给 AI 设定人格和能力边界，也就是告诉 AI “你是谁？你能做什么？”。
修改 chat 方法，代码如下：

private static final String SYSTEM_MESSAGE = """你是编程领域的小助手，帮助用户解答编程学习和求职面试相关的问题，并给出建议。重点关注 4 个方向：1. 规划清晰的编程学习路线2. 提供项目学习建议3. 给出程序员求职全流程指南（比如简历优化、投递技巧）4. 分享高频面试题和面试技巧请用简洁易懂的语言回答，助力用户高效学习与求职。""";public String chat(String message) {SystemMessage systemMessage = SystemMessage.from(SYSTEM_MESSAGE);UserMessage userMessage = UserMessage.from(message);ChatResponse chatResponse = qwenChatModel.chat(systemMessage, userMessage);AiMessage aiMessage = chatResponse.aiMessage();log.info("AI 输出：" + aiMessage.toString());return aiMessage.text();
}

5、AI 服务 - AI Service

在学习更多特性前，我们要了解 LangChain4j 最重要的开发模式 —— AI Service，提供了很多高层抽象的、用起来更方便的 API，把 AI 应用当做服务来开发。

使用 AI Service

首先引入 langchain4j 依赖：

<dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j</artifactId><version>1.1.0</version>
</dependency>

然后创建一个编程助手 AI Service 服务，采用声明式开发方法，编写一个对话方法，然后可以直接通过 @SystemMessage 注解定义系统提示词。

public interface AiCodeHelperService {@SystemMessage("你是一位编程小助手")String chat(String userMessage);
}

不过由于我们提示词较长，写到注解里很不优雅，所以单独在 resources 目录下新建文件 system-prompt.txt 来存储系统提示词。

public interface AiCodeHelperService {@SystemMessage(fromResource = "system-prompt.txt")String chat(String userMessage);
}

然后我们需要编写工厂类，用于创建 AI Service：

@Configuration
public class AiCodeHelperServiceFactory {@Resourceprivate ChatModel qwenChatModel;@Beanpublic AiCodeHelperService aiCodeHelperService() {return AiServices.create(AiCodeHelperService.class, qwenChatModel);}
}

调用 AiServices.create 方法就可以创建出 AI Service 的实现类了，背后的原理是利用 Java 反射机制创建了一个实现接口的代理对象，代理对象负责输入和输出的转换，比如把 String 类型的用户消息参数转为 UserMessage 类型并调用 ChatModel，再将 AI 返回的 AiMessage 类型转换为 String 类型作为返回值。

6、Spring Boot 项目中使用

如果你觉得手动调用 create 方法来创建 Service 比较麻烦，在 Spring Boot 项目中可以引入依赖：

<dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j-spring-boot-starter</artifactId><version>1.1.0-beta7</version>
</dependency>

然后给 AI Service 加上 @AiService 注解，就能自动创建出服务实例了：

@AiService
public interface AiCodeHelperService {@SystemMessage(fromResource = "system-prompt.txt")String chat(String userMessage);
}

记得注释掉之前工厂类的 @Configuration 注解，否则会出现 Bean 冲突

7、会话记忆 - ChatMemory

会话记忆是指让 AI 能够记住用户之前的对话内容，并保持上下文连贯性，这是实现 AI 应用的核心特性。

使用会话记忆

LangChain4j 为我们提供了开箱即用的 MessageWindowChatMemory 会话记忆，最多保存 N 条消息，多余的会自动淘汰。创建会话记忆后，在构造 AI Service 设置 chatMemory：

@Configuration
public class AiCodeHelperServiceFactory {@Resourceprivate ChatModel qwenChatModel;@Beanpublic AiCodeHelperService aiCodeHelperService() {// 会话记忆ChatMemory chatMemory = MessageWindowChatMemory.withMaxMessages(10);AiCodeHelperService aiCodeHelperService = AiServices.builder(AiCodeHelperService.class).chatModel(qwenChatModel).chatMemory(chatMemory).build();return aiCodeHelperService;}
}

8、结构化输出

结构化输出有 3 种实现方式：

利用大模型的 JSON schema
利用 Prompt + JSON Mode
利用 Prompt

比如我们增加一个让 AI 生成学习报告的方法，AI 需要输出学习报告对象，包含名称和建议列表：

@SystemMessage(fromResource = "system-prompt.txt")
Report chatForReport(String userMessage);// 学习报告
record Report(String name, List<String> suggestionList){}

编写单元测试：

@Test
void chatForReport() {String userMessage = "你好，我是程序员鱼亮，学编程两年半，请帮我制定学习报告";AiCodeHelperService.Report report = aiCodeHelperService.chatForReport(userMessage);System.out.println(report);
}

运行单元测试，效果很不错：
在这里插入图片描述
如果你发现 AI 有时无法生成准确的 JSON，那么可以采用 JSON Schema 模式，直接在请求中约束 LLM 的输出格式。这是目前最可靠、精确度最高的结构化输出实现。

ResponseFormat responseFormat = ResponseFormat.builder().type(JSON).jsonSchema(JsonSchema.builder().name("Person").rootElement(JsonObjectSchema.builder().addStringProperty("name").addIntegerProperty("age").addNumberProperty("height").addBooleanProperty("married").required("name", "age", "height", "married") .build()).build()).build();
ChatRequest chatRequest = ChatRequest.builder().responseFormat(responseFormat).messages(userMessage).build();

9、检索增强生成 - RAG

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合信息检索技术和 AI 内容生成的混合架构，可以解决大模型的知识时效性限制和幻觉问题。

简单来说，RAG 就像给 AI 配了一个 “小抄本”，让 AI 回答问题前先查一查特定的知识库来获取知识，确保回答是基于真实资料而不是凭空想象。很多企业也基于 RAG 搭建了自己的智能客服，可以用自己积累的领域知识回复用户。

RAG 的完整工作流程如下：
在这里插入图片描述
LangChain 提供了 3 种 RAG 的实现方式，我把它称为：极简版、标准版、进阶版。

极简版 RAG

极简版适合快速查看效果，首先需要引入额外的依赖，里面包含了内置的离线 Embedding 模型，开箱即用：

<dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j-easy-rag</artifactId><version>1.1.0-beta7</version>
</dependency>

示例代码如下，使用内置的文档加载器读取文档，然后利用内置的 Embedding 模型将文档转换成向量，并存储在内置的 Embedding 内存存储中，最后给 AI Service 绑定默认的内容检索器。

// RAG
// 1. 加载文档
List<Document> documents = FileSystemDocumentLoader.loadDocuments("src/main/resources/docs");
// 2. 使用内置的 EmbeddingModel 转换文本为向量，然后存储到自动注入的内存 embeddingStore 中
EmbeddingStoreIngestor.ingest(documents, embeddingStore);
// 构造 AI Service
AiCodeHelperService aiCodeHelperService = AiServices.builder(AiCodeHelperService.class).chatModel(qwenChatModel).chatMemory(chatMemory)// RAG：从内存 embeddingStore 中检索匹配的文本片段.contentRetriever(EmbeddingStoreContentRetriever.from(embeddingStore)).build();

可以看到，极简版的特点是 “一切皆默认”，实际开发中，为了更好的效果，建议采用标准版或进阶版。

标准版 RAG

下面来试试标准版 RAG 实现，为了更好地效果，我们需要：

加载 Markdown 文档并按需切割
Markdown 文档补充文件名信息
自定义 Embedding 模型
自定义内容检索器

在 Spring Boot 配置文件中添加 Embedding 模型配置，使用阿里云提供的 text-embedding-v4 模型：

langchain4j:community:dashscope:chat-model:model-name:qwen-maxapi-key:<YouAPIKeyhere>embedding-model:model-name:text-embedding-v4api-key:<YouAPIKeyhere>

新建 rag.RagConfig，编写 RAG 相关的代码，执行 RAG 的初始流程并返回了一个定制的内容检索器 Bean：

/*** 加载 Rag*/
@Configuration
public class RagConfig {@Resourceprivate EmbeddingModel qwenEmbeddingModel;@Resourceprivate EmbeddingStore<TextSegment> embeddingStore;@Beanpublic ContentRetriever contentRetriever(){// ---- Rag -----// 1、加载文件List<Document> document = FileSystemDocumentLoader.loadDocuments("src/main/resources/docs");// 2、文档切割：每个文档按照段落进行分割，最大1000个字符 每次最多重叠200个字符DocumentByParagraphSplitter documentByParagraphSplitter =new DocumentByParagraphSplitter(1000, 200);// 3、自定义文档加载器 把文档转化成向量并保存到向量数据库中EmbeddingStoreIngestor ingestor = EmbeddingStoreIngestor.builder()// 切割.documentSplitter(documentByParagraphSplitter)// 为了提高文档的质量，为每个切割后的文档碎片 TextSegment 添加文档名称作为元信息[file_name是固定写法，不可改].textSegmentTransformer(textSegment -> {return TextSegment.from(textSegment.metadata().getString("file_name") +"\n" + textSegment.text(), textSegment.metadata());})// 使用向量数据模型.embeddingModel(qwenEmbeddingModel)// 保存向量数据.embeddingStore(embeddingStore).build();// 加载文档ingestor.ingest(document);// 4、自定义内容加载器EmbeddingStoreContentRetriever contentRetriever = EmbeddingStoreContentRetriever.builder().embeddingStore(embeddingStore).embeddingModel(qwenEmbeddingModel).maxResults(5) // 最多返回5个结果.minScore(0.75) // 过滤分数小于 0.75的结果.build();return contentRetriever;}
}

然后在构建 AI Service 时绑定内容检索器：

@Resource
private ContentRetriever contentRetriever;@Bean
public AiCodeHelperService aiCodeHelperService() {// 会话记忆ChatMemory chatMemory = MessageWindowChatMemory.withMaxMessages(10);// 构造 AI ServiceAiCodeHelperService aiCodeHelperService = AiServices.builder(AiCodeHelperService.class).chatModel(qwenChatModel).chatMemory(chatMemory).contentRetriever(contentRetriever) // RAG 检索增强生成.build();return aiCodeHelperService;
}

编写单元测试：

@Test
void chatWithRag() {String chat = aiCodeHelperService.chat("怎么学习java?有哪些常见的面试题？");System.out.println(chat);
}

Debug 运行，能够看到分割的文档片段，部分文档片段有内容重叠：
在这里插入图片描述
可以在对话记忆中看到实际发送的、增强后的 Prompt：

回答效果也是符合预期的：

获取引用源文档

如果能够给 AI 的回答下面展示回答来源，更容易增加内容的可信度
在 LangChain4j 中，实现这个功能很简单。在 AI Service 中新增方法，在原本的返回类型外封装一层 Result 类，就可以获得封装后的结果，从中能够获取到 RAG 引用的源文档、以及 Token 的消耗情况等等。

@SystemMessage(fromResource = "system-prompt.txt")
Result<String> chatWithRag(String userMessage);

修改单元测试，输出更多信息：

@Test
void chatWithRag() {Result<String> result = aiCodeHelperService.chatWithRag("怎么学习 Java？有哪些常见面试题？");String content = result.content();List<Content> sources = result.sources();System.out.println(content);System.out.println(sources);
}

执行效果如图，获取到了引用的源文档信息：
在这里插入图片描述

10、工具调用 - Tools

工具调用（Tool Calling）可以理解为让 AI 大模型借用外部工具来完成它自己做不到的事情。

跟人类一样，如果只凭手脚完成不了工作，那么就可以利用工具箱来完成。

工具可以是任何东西，比如网页搜索、对外部 API 的调用、访问外部数据、或执行特定的代码等。

比如用户提问 “帮我查询上海最新的天气”，AI 本身并没有这些知识，它就可以调用 “查询天气工具”，来完成任务。

需要注意的是，工具调用的本质并不是 AI 服务器自己调用这些工具、也不是把工具的代码发送给 AI 服务器让它执行，它只能提出要求，表示 “我需要执行 XX 工具完成任务”。而真正执行工具的是我们自己的应用程序，执行后再把结果告诉 AI，让它继续工作。
第一步：先引入 Jsoup 库：

<dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.20.1</version>
</dependency>

然后在 tools 包下编写工具，通过 @Tool 注解就能声明工具了，注意要认真编写工具和工具参数的描述，这直接决定了 AI 能否正确地调用工具。

@Slf4j
publicclass InterviewQuestionTool {/*** 从面试网站获取关键词相关的面试题列表** @param keyword 搜索关键词（如"redis"、"java多线程"）* @return 面试题列表，若失败则返回错误信息*/@Tool(name = "interviewQuestionSearch", value = """Retrieves relevant interview questions from mianshiya.com based on a keyword.Use this tool when the user asks for interview questions about specific technologies,programming concepts, or job-related topics. The input should be a clear search term.""")public String searchInterviewQuestions(@P(value = "the keyword to search") String keyword) {List<String> questions = new ArrayList<>();// 构建搜索URL（编码关键词以支持中文）String encodedKeyword = URLEncoder.encode(keyword, StandardCharsets.UTF_8);String url = "https://www.mianshiya.com/search/all?searchText=" + encodedKeyword;// 发送请求并解析页面Document doc;try {doc = Jsoup.connect(url).userAgent("Mozilla/5.0").timeout(5000).get();} catch (IOException e) {log.error("get web error", e);return e.getMessage();}// 提取内容Elements questionElements = doc.select(".ant-table-cell > a");questionElements.forEach(el -> questions.add(el.text().trim()));return String.join("\n", questions);}
}

给 AI Service 绑定工具：

// 构造 AI Service
AiCodeHelperService aiCodeHelperService = AiServices.builder(AiCodeHelperService.class).chatModel(qwenChatModel).chatMemory(chatMemory).contentRetriever(contentRetriever) // RAG 检索增强生成.tools(new InterviewQuestionTool()) // 工具调用.build();

编写单元测试，验证工具的效果：

@Test
void chatWithTools() {String result = aiCodeHelperService.chat("有哪些常见的计算机网络面试题？");System.out.println(result);
}

Debug 运行，发现 AI 调用了工具：
在这里插入图片描述
工具检索到了题目列表：

可以通过 Debug 看到 AI Service 加载了工具：

11、模型上下文协议 - MCP

MCP（Model Context Protocol，模型上下文协议）是一种开放标准，目的是增强 AI 与外部系统的交互能力。MCP 为 AI 提供了与外部工具、资源和服务交互的标准化方式，让 AI 能够访问最新数据、执行复杂操作，并与现有系统集成。

可以将 MCP 想象成 AI 应用的 USB 接口。就像 USB 为设备连接各种外设和配件提供了标准化方式一样，MCP 为 AI 模型连接不同的数据源和工具提供了标准化的方法。
请添加图片描述
简单来说，通过 MCP 协议，AI 应用可以轻松接入别人提供的服务来实现更多功能，比如查询地理位置、操作数据库、部署网站、甚至是支付等等。

刚刚我们通过工具调用实现了面试题的搜索，下面我们利用 MCP 实现全网搜索内容，这也是一个典型的 MCP 应用场景了。

引入依赖：

<!-- https://mvnrepository.com/artifact/dev.langchain4j/langchain4j-mcp -->
<dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j-mcp</artifactId><version>1.1.0-beta7</version>
</dependency>

在配置文件中新增 API Key 的配置：

bigmodel:api-key: <Your Api Key>

新建 mcp.McpConfig，按照官方的开发方式，初始化和 MCP 服务的通讯，并创建 McpToolProvider 的 Bean：

@Configuration
publicclass McpConfig {@Value("${bigmodel.api-key}")private String apiKey;@Beanpublic McpToolProvider mcpToolProvider() {// 和 MCP 服务通讯McpTransport transport = new HttpMcpTransport.Builder().sseUrl("https://open.bigmodel.cn/api/mcp/web_search/sse?Authorization=" + apiKey).logRequests(true) // 开启日志，查看更多信息.logResponses(true).build();// 创建 MCP 客户端McpClient mcpClient = new DefaultMcpClient.Builder().key("yupiMcpClient").transport(transport).build();// 从 MCP 客户端获取工具McpToolProvider toolProvider = McpToolProvider.builder().mcpClients(mcpClient).build();return toolProvider;}
}

注意，上面我们是通过 SSE 的方式调用 MCP。如果你是通过 npx 或 uvx 本地启动 MCP 服务，需要先安装对应的工具，并且利用下面的配置建立通讯：

McpTransport transport = new StdioMcpTransport.Builder().command(List.of("/usr/bin/npm", "exec", "@modelcontextprotocol/server-everything@0.6.2")).logEvents(true) // only if you want to see the traffic in the log.build();

在 AI Service 中应用 MCP 工具：

@Resource
private McpToolProvider mcpToolProvider;// 构造 AI Service
AiCodeHelperService aiCodeHelperService = AiServices.builder(AiCodeHelperService.class).chatModel(qwenChatModel).chatMemory(chatMemory).contentRetriever(contentRetriever) // RAG 检索增强生成.tools(new InterviewQuestionTool()) // 工具调用.toolProvider(mcpToolProvider) // MCP 工具调用.build();

编写单元测试：

@Test
void chatWithMcp() {String result = aiCodeHelperService.chat("什么是程序员鱼皮的编程导航？");System.out.println(result);
}

在这里插入图片描述

12、护轨 - Guardrail

分为输入护轨（input guardrails）和输出护轨（output guardrails），可以在请求 AI 前和接收到 AI 的响应后执行一些额外操作，比如调用 AI 前鉴权、调用 AI 后记录日志。请添加图片描述
让我们小试一把，在调用 AI 前进行敏感词检测，如果用户提示词包含敏感词，则直接拒绝。

新建 guardrail.SafeInputGuardrail，实现 InputGuardrail 接口：

/*** 安全检测输入护轨*/
publicclass SafeInputGuardrail implements InputGuardrail {privatestaticfinal Set<String> sensitiveWords = Set.of("kill", "evil");/*** 检测用户输入是否安全*/@Overridepublic InputGuardrailResult validate(UserMessage userMessage) {// 获取用户输入并转换为小写以确保大小写不敏感String inputText = userMessage.singleText().toLowerCase();// 使用正则表达式分割输入文本为单词String[] words = inputText.split("\\W+");// 遍历所有单词，检查是否存在敏感词for (String word : words) {if (sensitiveWords.contains(word)) {return fatal("Sensitive word detected: " + word);}}return success();}
}

修改 AI Service，使用输入护轨：

@InputGuardrails({SafeInputGuardrail.class}) // 添加输入护轨
public interface AiCodeHelperService {

编写单元测试，写一个包含敏感词的提示词：

@Test
void chatWithGuardrail() {String result = aiCodeHelperService.chat("kill the game");System.out.println(result);
}

运行并查看效果，会触发输入检测，直接抛出异常：
在这里插入图片描述
当然，除了输入护轨，也可以编写输出护轨，对 AI 的响应结果进行检测。

13、日志和可观测性

开启日志的方法很简单，直接构造模型时指定开启、或者直接编写 Spring Boot 配置，支持打印 AI 请求和响应日志。

但并不是所有的 ChatModel 都支持，比如我测试下来 QwenChatModel 就不支持。这时只能把希望交给可观测性了。

可观测性

可以通过自定义 Listener 获取 ChatModel 的调用信息，比较灵活。

新建 listener.ChatModelListenerConfig，输出请求、响应、错误信息：

@Configuration
@Slf4j
publicclass ChatModelListenerConfig {@BeanChatModelListener chatModelListener() {returnnew ChatModelListener() {@Overridepublic void onRequest(ChatModelRequestContext requestContext) {log.info("onRequest(): {}", requestContext.chatRequest());}@Overridepublic void onResponse(ChatModelResponseContext responseContext) {log.info("onResponse(): {}", responseContext.chatResponse());}@Overridepublic void onError(ChatModelErrorContext errorContext) {log.info("onError(): {}", errorContext.error().getMessage());}};}
}

但是只定义 Listener 好像对 QwenChatModel 不起作用，所以我们需要手动构造自定义的 QwenChatModel。

新建 model.QwenChatModelConfig，构造 ChatModel 对象并绑定 Listener：

@Configuration
@ConfigurationProperties(prefix = "langchain4j.community.dashscope.chat-model")
@Data
publicclass QwenChatModelConfig {private String modelName;private String apiKey;@Resourceprivate ChatModelListener chatModelListener;@Beanpublic ChatModel myQwenChatModel() {return QwenChatModel.builder().apiKey(apiKey).modelName(modelName).listeners(List.of(chatModelListener)).build();}
}

然后，我们将AiCodeHelpServiceFactory中引用的ChatModel 的名称改为 myQwenChatModel，防止和 Spring Boot 自动注入的 ChatModel 冲突。

再次调用 AI，就能看到很多信息了：
在这里插入图片描述

14、AI 服务化

AI 的能力基本开发完成，但是目前只支持本地运行，需要编写一个接口提供给前端调用，让 AI 能够成为一个服务。

我们平时开发的大多数接口都是同步接口，也就是等后端处理完再返回。但是对于 AI 应用，特别是响应时间较长的对话类应用，可能会让用户失去耐心等待，因此推荐使用 SSE（Server-Sent Events）技术实现实时流式输出，类似打字机效果，大幅提升用户体验。

SSE 流式接口开发

LangChain 提供了 2 种方式来支持流式响应（注意，流式响应不支持结构化输出）。

一种方法是 TokenStream，先让 AI 对话方法返回 TokenStream，然后创建 AI Service 时指定流式对话模型 StreamingChatModel：

interface Assistant {TokenStream chat(String message);
}StreamingChatModel model = OpenAiStreamingChatModel.builder().apiKey(System.getenv("OPENAI_API_KEY")).modelName(GPT_4_O_MINI).build();Assistant assistant = AiServices.create(Assistant.class, model);TokenStream tokenStream = assistant.chat("Tell me a joke");tokenStream.onPartialResponse((String partialResponse) -> System.out.println(partialResponse)).onRetrieved((List<Content> contents) -> System.out.println(contents)).onToolExecuted((ToolExecution toolExecution) -> System.out.println(toolExecution)).onCompleteResponse((ChatResponse response) -> System.out.println(response)).onError((Throwable error) -> error.printStackTrace()).start();

我个人会更喜欢另一种方法，使用 Flux 代替 TokenStream，熟悉响应式编程的同学应该对 Flux 不陌生吧？让 AI 对话方法返回 Flux 响应式对象即可。

首先需要引入响应式包依赖：

<dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j-reactor</artifactId><version>1.1.0-beta7</version>
</dependency>

然后给 AI Service 增加流式对话方法，这里顺便支持下多用户的会话记忆：

// 流式对话
Flux<String> chatStream(@MemoryId int memoryId, @UserMessage String userMessage);

由于要用到流式模型，需要增加流式模型配置：

langchain4j:community:dashscope:streaming-chat-model:model-name: qwen-maxapi-key: <Your Api Key>

构造 AI Service 时指定流式对话模型（自动注入即可），并且补充会话记忆提供者：
在这里插入图片描述
最后，编写 Controller 接口。为了方便测试，这里使用 Get 请求：

@RestController
@RequestMapping("/api")
public class AiController {@Resourceprivate AiCodeHelperService aiCodeHelperService;@GetMapping("/chat")public Flux<ServerSentEvent<String>> chat(int memoryId, String userMessage){return aiCodeHelperService.chatStream(memoryId, userMessage).map(chunk  -> ServerSentEvent.<String>builder().data(chunk).build());}
}

增加服务器配置，指定后端端口和接口路径前缀：

server:port: 8081servlet:context-path: /api

使用ApiFox测试:
在这里插入图片描述

后端支持跨域

为了让前端项目能够顺利调用后端接口，我们需要在后端配置跨域支持。在 config 包下创建跨域配置类，代码如下：

/*** 全局跨域配置*/
@Configuration
publicclass CorsConfig implements WebMvcConfigurer {@Overridepublic void addCorsMappings(CorsRegistry registry) {// 覆盖所有请求registry.addMapping("/**")// 允许发送 Cookie.allowCredentials(true)// 放行哪些域名（必须用 patterns，否则 * 会和 allowCredentials 冲突）.allowedOriginPatterns("*").allowedMethods("GET", "POST", "PUT", "DELETE", "OPTIONS").allowedHeaders("*").exposedHeaders("*");}
}

注意，如果 .allowedOrigins(“*”) 与 .allowCredentials(true) 同时配置会导致冲突，因为出于安全考虑，跨域请求不能同时允许所有域名访问和发送认证信息（比如 Cookie）。

15、AI 生成前端

我们可以利用 AI 来快速生成前端代码，极大提高开发效率。这里鱼皮使用主流 AI 开发工具 Trae，挑战不写一行代码，生成符合要求的前端项目。你应该使用 Windows 支持的命令来完成任务。

提示词

首先准备一段详细的 Prompt，一般要包括需求、技术选型、后端接口信息，还可以提供一些原型图、后端代码等。

你是一位专业的前端开发，请帮我根据下列信息来生成对应的前端项目代码。

## 需求应用为《AI 编程小助手》，帮助用户解答编程学习和求职面试相关的问题，并给出建议。只有一个页面，就是主页：页面风格为聊天室，上方是聊天记录（用户信息在右边，AI 信息在左边），下方是输入框，进入页面后自动生成一个聊天室 id，用于区分不同的会话。通过 SSE 的方式调用 chat 接口，实时显示对话内容。## 技术选型1. Vue3 项目
2. Axios 请求库## 后端接口信息接口地址前缀：http://localhost:8081/api## SpringBoot 后端接口代码@RestController
@RequestMapping("/api")
public class AiController {@GetMapping("/chat")public Flux<ServerSentEvent<String>> chat(int memoryId, String message) {return aiCodeHelperService.chatStream(memoryId, message).map(chunk -> ServerSentEvent.<String>builder().data(chunk).build());}
}