Spring AI 1.0 GA 于 2025 年 5 月 20 日正式发布,都有哪些特性?
Spring AI 1.0 GA 于 2025 年 5 月 20 日正式发布,标志着 Spring 生态系统全面拥抱人工智能技术,
看看都有哪些更新
1. 统一的 ChatClient
接口
- 多模型支持:通过
ChatClient
提供可移植的 API,支持调用 20 多个 AI 模型,包括 Anthropic、ZhiPu、DeepSeek、MiniMax 等,并兼容 OpenAI API 规范。用户可通过配置轻松切换不同模型。 - 多模态与结构化输出:支持文本、图像、音频等多模态输入/输出(需底层模型支持),且响应可格式化为 JSON,便于程序处理。
- 灵活配置:支持单模型全局配置或多模型按需调用(如通过
@Qualifier
注解指定模型)。
2. 检索增强生成(RAG)与向量存储
- 向量数据库兼容性:提供可移植的向量存储抽象层,支持 Azure Cosmos DB、Weaviate、Pinecone、Redis 等 20 种向量数据库,并通过类 SQL 语法简化查询。
- ETL 框架:内置轻量级 ETL 工具,支持从本地文件、S3、GitHub、Kafka 等来源提取数据,并自动分块、生成嵌入向量,简化 RAG 流程构建。
- 模块化 RAG 管道:支持从简单的上下文注入(
QuestionAnswerAdvisor
)到复杂定制化流程(RetrievalAugmentationAdvisor
)。
3. 对话记忆管理
- 动态记忆存储:通过
ChatMemory
接口管理对话历史,支持滑动窗口(MessageWindowChatMemory
)存储最近消息或向量搜索(VectorStoreChatMemoryAdvisor
)从历史中检索语义相似内容。 - 持久化支持:提供 JDBC、Cassandra、Neo4j 等存储实现,确保对话记录的长期保存与恢复。
4. 工具调用与扩展性
- 自定义工具集成:通过
@Tool
注解定义工具函数(如查询天气、数据库操作),使 AI 模型能调用外部 API 或触发工作流,扩展应用场景。 - 模型上下文协议(MCP):支持标准化工具交互协议,简化客户端与服务器的 MCP 集成,支持 OAuth 安全认证和 HTTP-SSE 端点。
5. 评估与可观测性
- 内容质量评估:提供
RelevancyEvaluator
(相关性验证)和FactCheckingEvaluator
(事实核查),结合小模型(如 Minicheck)降低验证成本。 - 性能监控:集成 Micrometer 追踪模型延迟、Token 使用量、工具调用频率等指标,支持日志记录与分布式追踪(Micrometer Tracing)。
6. 其他关键改进
- 工作流模式:支持路由(智能请求分发)、编排(动态任务分解)、并行化(批量调用聚合)等代理模式,简化复杂任务处理。
- 云服务集成:与 AWS、Azure、Google Cloud 等云平台深度整合,提供企业级案例(如 Elasticsearch 向量存储、MongoDB RAG 应用)。
- 移除千帆模型支持:因境外访问限制,移除了百度千帆模型的 SDK,仅保留 DeepSeek 和智普等国内模型。
总结
Spring AI 1.0 GA 通过标准化接口、模块化设计及丰富的生态集成,降低了企业构建 AI 应用的门槛。其核心优势在于可扩展性(多模型、多数据库支持)与生产就绪性(评估、监控、安全),为 Java 开发者提供了完整的 AI 开发生态。更多技术细节可参考官方文档及配套示例代码。