当前位置：首页 > news >正文

AI应用服务

news 2025/7/16 5:58:54

AI大模型--AI应用，该如何和前端交互，呈现llm模型答复内容呢？

向LLM大模型提问后，系统得先识别问题，再从数据网络找信息，接着推理出正确结果，还得防止模型“胡编乱造”（控制模型幻想）。有时多个智能体（agent）要一起处理，结果还得融合。这些步骤都是异步进行的，没法像传统应用接口那样实时出结果。为减少大模型结果延迟、提升用户体验，我们提供以下方案。

方案1、轮询

后端pedding结果到db或其他存储层。前端通过应用接口密集轮询存储层结果。

例：支付订单状态查询等

方案2、SSE

前端和后端建立半连接状态，后端处理llm结果的同时实时推送给前端，并异步到存储层。目前来看，该方案最优。大部分竞品：豆包、deepseek、文心一言、智谱清言... 皆沿用该方案。

例：及时消息通信等

方案3、application/ndjson

Java可以通过HttpServletResponse或StreamingResponseBody方式实现。

例：日志以及批量文件上传等

方案4、socket

不在依赖http协议，而是ws://localhost:端口号/...

例：打印机等

文章转载自：
http://capsulate.jopebe.cn
http://barogram.jopebe.cn
http://auxesis.jopebe.cn
http://breathhold.jopebe.cn
http://administerial.jopebe.cn
http://alanine.jopebe.cn
http://agency.jopebe.cn
http://casebearer.jopebe.cn
http://blurb.jopebe.cn
http://bankable.jopebe.cn
http://chromatin.jopebe.cn
http://archeolithic.jopebe.cn
http://braless.jopebe.cn
http://accompany.jopebe.cn
http://belock.jopebe.cn
http://anking.jopebe.cn
http://apennine.jopebe.cn
http://cambrel.jopebe.cn
http://baciamano.jopebe.cn
http://bobbly.jopebe.cn
http://bonanza.jopebe.cn
http://asparagus.jopebe.cn
http://bandsman.jopebe.cn
http://beanery.jopebe.cn
http://antialien.jopebe.cn
http://ascensiontide.jopebe.cn
http://bratty.jopebe.cn
http://carboniferous.jopebe.cn
http://bankbook.jopebe.cn
http://arch.jopebe.cn

查看全文

http://www.dtcms.com/a/280455.html

整除分块练习题

某地金属矿山自动化监测服务项目

Python 数据建模与分析项目实战预备 Day 6 - 多模型对比与交叉验证验证策略

2.【C# in .NET】探秘数据类型：从底层机制到实战启示

MySQL高级篇（二）：深入理解数据库事务与MySQL锁机制

农村养老模式：乡土智慧与时代创新的共生之路

【每日算法】专题十_字符串

PySpark Standalone 集群

react native学习record one month

Flink SQL 性能优化实战

使用Dify+fastmcp 实现mcp服务，内含详细步骤与源码

Windows远程FX的编解码器性能优化

算法在前端框架中的集成

三十二、【核心功能改造】数据驱动：重构仪表盘与关键指标可视化

原型继承（prototypal inheritance）的工作原理

Java实现word、pdf转html保留格式

19.如何将 Python 字符串转换为 Slug

全面安装指南：在Linux、Windows和macOS上部署Apache Cassandra

基于STM32与中航ZH-E3L字符卡通信在LED屏显示数据

华为敏态开发流程敏捷开发费用估算敏态IT财务分析模板

进程探秘：从 PCB 到 fork 的核心原理之旅

Lang3

Spring Ioc Bean 到底是什么

朝鲜升级供应链恶意软件XORIndex，再次瞄准npm生态系统

从springcloud-gateway了解同步和异步，webflux webMvc、共享变量

四种高效搭建SpringBoot项目的方式详解

基于UDP/IP网络游戏加速高级拥塞控制算法（示意：一）

SpringBoot 实现 Redis读写分离

【PTA数据结构 | C语言版】根据前序序列重构二叉树

npm install failed如何办？

相关文章：