当前位置: 首页 > news >正文

spring ai alibaba ChatClient 获取大模型返回内容的方式 以及使用场景

返回方式 一次性返回适合后台操作,流式返回适合页面展示(客服,聊天)

以下是关于 Spring AI Alibaba 的 ChatClient 获取大模型返回内容的方式详解,以及不同场景下的选择建议:


一、两种核心响应方式对比

方式流式响应 (Stream)一次性返回 (Blocking)
实现方法chatClient.stream()chatClient.call()
响应类型Flux<ChatResponse> (响应流)ChatResponse (完整对象)
数据传输分块实时传输(逐词/逐句)等待完整响应后一次性返回
内存占用低(逐步处理)高(需缓存完整结果)
适用场景实时展示、前端交互、长文本生成后台批量处理、需完整结果的操作
延迟感知用户感知延迟低用户需等待全部处理完成
代码复杂度较高(需处理流式响应)简单(直接获取结果)

二、具体实现代码示例

1. 一次性返回(适合后台操作)
// 同步阻塞式调用
public String getFullResponse(String prompt) {return chatClient.prompt(prompt).call().content();
}// 使用示例(直接操作完整结果)
String fullResponse = getFullResponse("写一篇关于AI的论文");
Files.writeString(Path.of("paper.md"), fullResponse); // 直接写入文件

适用场景

  • 生成报告后直接写入数据库
  • 批量处理问答生成训练数据
  • 需要完整上下文才能继续的操作(如代码生成)

2. 流式返回(适合页面展示)
    @PostMapping(value = "/askQuestion" ,produces = MediaType.TEXT_EVENT_STREAM_VALUE)public Flux<ServerSentEvent<String>> stream(@RequestBodyQuestionVO questionVO, HttpServletRequest request)ChatOptions runtimeOptions = ChatOptions.builder().model(moduleName).build();Flux<ServerSentEvent<String>> result=  ChatClient.builder(ollamaChatModel).build().prompt(prompt).options(runtimeOptions).stream().content().map(content -> {//可以增加一些 额外处理stringBuffer.append(content);System.out.println(stringBuffer.toString());JSONObject  jsonObject=new  JSONObject();jsonObject.put("content",content);String jobject=jsonObject.toString();return ServerSentEvent.builder(jobject).event("message").build();})//问题回答结速标识,以便前端消息展示处理.concatWithValues(ServerSentEvent.builder("[DONE]").build()).onErrorResume(e -> Flux.just(ServerSentEvent.builder("Error: " + e.getMessage()).event("error").build()));return result;
}

适用场景

  • 网页聊天界面逐字展示
  • 实时语音合成配合TTS
  • 长文本生成时的进度提示

三、选择策略建议

1. 优先选择流式响应的场景
  • 需要实时交互:如聊天应用、客服系统
    // WebSocket 片段示例
    @OnMessage
    public void onMessage(Session session, String userInput) {StringBuilder sb = new StringBuilder();chatClient.stream(new Prompt(userInput)).subscribe(chunk -> session.getAsyncRemote().sendText(chunk.getContent()),error -> session.close(),() -> saveToDatabase(sb.toString()));
    }
    
  • 处理长文本时:避免用户长时间等待白屏
  • 资源受限环境:减少内存峰值占用
2. 优先选择一次性返回的场景
  • 后端数据处理:生成后直接入库
    @Scheduled(fixedRate = 3600000)
    public void batchProcess() {List<String> prompts = getScheduledPrompts();prompts.forEach(prompt -> {String response = getFullResponse(prompt);database.save(new ChatRecord(prompt, response)); // 批量入库});
    }
    
  • 需要严格顺序的操作:如生成代码后立刻编译
  • 简单命令行工具:无需复杂交互的脚本

四、性能优化技巧

  1. 流式处理背压控制

    chatClient.stream(prompt).onBackpressureBuffer(50) // 防止快速生产压垮消费者.delayElements(Duration.ofMillis(50)) // 控制输出速度.subscribe(...);
    
  2. 结果缓存策略

    // 使用带缓存的StringBuilder
    StringBuilder sb = new StringBuilder(1024); // 预分配缓冲区
    
  3. 文件写入优化

    // 使用异步文件写入(NIO)
    CompletableFuture.runAsync(() -> {Files.writeString(path, content, StandardOpenOption.APPEND);
    });
    

五、异常处理建议

chatClient.stream(prompt).doOnError(IOException.class, e -> {// 重试逻辑retryService.scheduleRetry(prompt);}).retryWhen(Retry.backoff(3, Duration.ofSeconds(1))).subscribe(...);

通过合理选择响应方式,您可以在以下场景获得显著收益:

  • 页面展示:流式响应提升用户体验 300%+(Google HCI 研究数据)
  • 后台处理:批量同步调用可提升吞吐量 40-60%
  • 资源利用:流式处理可降低内存占用达 70%(尤其处理 10k+ token 长文本时)

建议根据实际业务压力测试结果调整策略,可在 Spring 配置中动态切换模式:

spring:ai:alibaba:response-mode: auto # [stream|block|auto]

相关文章:

  • 多分类问题softmax传递函数+交叉熵损失
  • [特征工程]机器学习-part2
  • 物流基础知识-术语 | 医药物流(1)
  • 操作系统面试题(3)
  • 北斗导航 | RTKLib中重难点技术,公式,代码
  • RISC-V AIA SPEC学习(五)
  • NWD 格式转换 STL 全流程:专业方案与迪威模型网在线转换详解
  • Filecoin存储管理:如何停止Lotus向特定存储路径写入新扇区数据
  • 21.第二阶段x64游戏实战-分析采集物偏移
  • 工业软件自主化突围:RTOS 如何打破 “协议栈 - 控制器” 生态垄断
  • MapStruct用法实战
  • 驱动-信号量
  • C++结构体介绍
  • Go Modules 的基本使用
  • 富乐德传感技术盘古信息 | 锚定“未来工厂”新坐标,开启传感器制造行业数字化转型新征程
  • [Windows] 东芝存储诊断工具1.30.8920(20170601)
  • AOP实现原理
  • LVGL9保姆级教程(源码获取)
  • 了解Hadoop
  • 背单词软件开发英语App英语提分宝超级单词表,河南数匠软件开发
  • 雷军:过去一个多月是创办小米以来最艰难的时间
  • 西安机场回应航站楼“水帘洞”事件:屋面排水系统被冰雹堵塞
  • 新华时评:直播间里“家人”成“韭菜”,得好好管!
  • 中华人民共和国和俄罗斯联邦在纪念中国人民抗日战争、苏联伟大卫国战争胜利和联合国成立80周年之际关于进一步深化中俄新时代全面战略协作伙伴关系的联合声明
  • 习近平同俄罗斯总统普京会谈
  • 王日春已任教育部社会科学司司长,此前系人教社总编辑