当前位置：首页 > news >正文

Spring AI 与大语言模型工具调用机制详细笔记

news 2025/7/17 12:45:14

一、基本概念

大语言模型（LLM）工具调用机制是一种允许AI模型与外部系统交互的技术框架，它使模型能够在对话过程中请求调用预定义的函数或服务。这种机制极大地扩展了大模型的能力边界，使其不再局限于静态知识，而是能够实时获取信息、执行计算、访问数据库或调用业务逻辑。在Spring AI中，这一机制通过结构化的接口和注解系统实现，为开发者提供了简洁而强大的方式来集成AI能力与现有业务系统。

二、工具调用原理

1. 核心思想

职责分离：大模型负责理解用户意图并决定何时调用工具，但不直接执行代码。模型只会生成调用指令，描述应该调用哪个工具以及使用什么参数。
安全执行：实际的代码执行完全由应用框架控制，确保了系统安全性和可靠性。开发者可以严格限制模型能够访问的功能范围。
双向通信：执行结果会返回给模型，模型结合这些信息生成最终对用户的回复，形成一个完整的信息流循环。
语义映射：框架负责将模型的自然语言理解转换为具体的程序调用，并将程序输出转回自然语言。

2. 代码示例与解析

ChatClient.CallResponseSpec response = llmService.getPlanningChatClient().prompt(prompt).tools(List.of(planningTool.getFunctionToolCallback())).advisors(memoryAdvisor -> memoryAdvisor.param("chat_memory_conversation_id", planId).param("chat_memory_retrieve_size", 100)).call();

这段代码展示了Spring AI中构建工具调用请求的完整过程，它通过链式调用方式设置了对话内容、可用工具和记忆管理等关键参数，最终发起API调用并获取响应结果。

三、方法详细解析

getPlanningChatClient()：
获取专用于规划任务的聊天客户端实例。这是一个工厂方法，根据特定任务类型返回配置好的客户端对象。客户端封装了与大模型通信的所有细节，包括认证、请求格式化、响应解析等复杂逻辑。
prompt()：
设置发送给模型的提示词或用户问题。提示词是模型理解用户意图的关键，它可以包含任务描述、上下文信息、约束条件和期望输出格式等内容。良好设计的提示词能显著提高模型响应的准确性和相关性。
tools()：
注册可供模型调用的工具函数列表。每个工具都包含函数名称、参数定义、功能描述等元数据，这些信息会被序列化为统一格式（通常是JSON Schema）发送给模型。模型根据这些描述理解每个工具的功能和使用方法，从而在合适的时机选择调用。
advisors()：
配置对话记忆和上下文管理的高级参数。通过设置会话ID和检索大小，系统能够维护长期对话历史，使模型了解之前的交互内容，保持对话的连贯性和一致性。这对于需要多轮交互的复杂任务尤为重要。
call()：
执行实际的API调用，将请求发送给大模型服务，并等待响应结果。这个方法负责处理网络通信、错误重试、超时控制等底层细节，同时将响应解析为结构化的对象返回给调用者。

四、完整交互流程

1. 工具注册阶段

在应用启动或模块初始化时，开发者通过@Tool注解或实现特定接口的方式，将Java方法注册为AI可调用的工具。这些工具注册信息会被Spring容器管理，并在需要时提供给模型调用系统。注册过程可以包含详细的元数据，如参数描述、类型信息、示例值和使用限制等，帮助模型更准确地使用这些工具。

2. 请求构建与发送

当用户发起询问时，系统构建包含提示词和可用工具列表的请求：

chatClient.prompt("请问北京今天的天气如何？明天是否适合户外活动？").tools(List.of(weatherTool, activitySuggestionTool)).call();

请求被序列化为API所需的格式，工具描述以规范化的schema形式附加在请求中，随后通过HTTP或其他协议发送给大模型服务。

3. 大模型分析与决策

大模型接收到请求后，首先理解用户的问题和意图。模型会分析问题是否需要额外信息来回答，以及这些信息是否可以通过提供的工具获取。如果模型确定需要调用工具，它会生成一个结构化的调用指令，例如：

{"function_call": {"name": "getWeather","arguments": {"city": "北京","date": "today"}}
}

这个指令清晰地表达了模型希望调用哪个函数、使用什么参数，但模型本身不会执行任何实际代码。

4. 框架执行工具调用

Spring AI框架接收到模型的响应后，解析其中的function_call字段，并执行以下步骤：

根据函数名查找对应的已注册Java方法
验证参数类型和数量是否匹配
将JSON参数转换为Java对象
通过反射或直接调用执行目标方法
捕获方法返回值和可能的异常
将结果序列化为标准格式

整个过程由框架严格控制，确保了安全性和可靠性。任何未注册的方法都无法被调用，参数也会经过类型检查和验证。

5. 结果反馈与最终回复生成

工具执行的结果被格式化后，再次发送给大模型，作为对原始function_call的响应。模型接收到执行结果后，会结合这些新信息和原始问题，生成最终的自然语言回复。例如，模型可能基于获取的天气数据，回复：
“根据最新数据，北京今天晴朗，气温25°C，空气质量良好。明天预计有小雨，不太适合户外活动，建议选择室内场所。”

这种回复融合了工具提供的客观数据和模型自身的推理能力，为用户提供了既准确又自然的回答。

五、流程图解析

┌─────────────┐         ┌──────────────────┐         ┌───────────────┐
│  用户提问   │───────→│ 构建请求          │───────→│  大模型服务   │
└─────────────┘         │ (prompt+tools)   │         └───────┬───────┘↑                 └──────────────────┘                 ││                                                      │
┌─────┴─────────┐                                     ┌──────▼───────┐
│ 最终回复      │                                     │ 分析是否需要 │
│ 展示给用户    │                                     │ 调用工具     │
└───────────────┘                                     └──────┬───────┘↑                                                      ││                                                      │
┌─────┴─────────┐        ┌───────────────────┐       ┌──────▼───────┐
│ 模型生成      │◀───────┤ 模型处理工具结果  │◀──────┤ 输出调用指令│
│ 最终回复      │        └───────────────────┘       └──────┬───────┘
└───────────────┘                                           │↑                                                     ││                                                     │
┌─────┴─────────┐        ┌───────────────────┐       ┌──────▼───────┐
│ 框架返回      │◀───────┤ 框架执行本地方法  │◀──────┤ 框架解析    │
│ 执行结果      │        └───────────────────┘       │ function_call│
└───────────────┘                                     └──────────────┘

这个流程图展示了从用户提问到最终回复的完整过程，包括请求构建、模型决策、工具调用、结果处理和回复生成等关键环节。每个步骤都由专门的组件负责，形成了一个高效协作的系统。

六、实现详细示例

工具定义与参数处理

@Component
public class WeatherService {@Tool(name = "getWeather",description = "获取指定城市的天气预报信息，包括温度、湿度、风力等数据")public WeatherInfo getWeather(@Param(name = "city", description = "需要查询天气的城市名称") String city,@Param(name = "date", description = "查询日期，可选值：today, tomorrow, week") String date) {// 实现天气查询逻辑，可能涉及调用第三方API、查询数据库等WeatherInfo weatherInfo = weatherApiClient.queryWeather(city, date);// 对查询结果进行处理和转换if (weatherInfo != null) {// 或许需要格式化某些数据weatherInfo.setTemperature(formatTemperature(weatherInfo.getRawTemperature()));// 添加额外信息weatherInfo.setQueryTime(LocalDateTime.now());}return weatherInfo;}// 辅助方法private String formatTemperature(Double rawTemp) {return String.format("%.1f°C", rawTemp);}
}

这个例子展示了一个完整的天气查询工具定义，包括工具名称、描述、参数注解和实际业务逻辑实现。@Tool注解标记方法为可调用工具，@Param注解为每个参数提供详细说明，帮助模型理解如何正确使用该工具。

客户端调用与结果处理

@Service
public class WeatherQueryService {private final ChatClient chatClient;private final WeatherService weatherService;@Autowiredpublic WeatherQueryService(ChatClient chatClient, WeatherService weatherService) {this.chatClient = chatClient;this.weatherService = weatherService;}public String askAboutWeather(String userQuestion) {try {// 构建带工具的请求ChatResponse response = chatClient.prompt(userQuestion).tools(List.of(new FunctionTool(weatherService.getClass().getMethod("getWeather", String.class, String.class)))).withSystemMessage("你是一个专业的天气助手，可以回答关于天气的各类问题。必要时请使用提供的工具获取准确信息。").call();// 从响应中提取回复内容String answer = response.content();// 可能的后处理，如记录日志、分析用户问题模式等logUserInteraction(userQuestion, answer);return answer;}catch (Exception e) {log.error("Weather query failed", e);return "很抱歉，处理您的天气查询请求时遇到了问题。请稍后再试。";}}private void logUserInteraction(String question, String answer) {// 实现日志记录逻辑}
}

这段代码展示了如何在服务层集成工具调用，包括异常处理、系统提示词设置和结果处理等完整流程。通过依赖注入获取所需组件，然后构建请求、执行调用并处理响应，最终返回用户可理解的结果。

七、功能特性与优势

安全性与控制：
模型只能调用显式注册的方法，无法执行任意代码。每个工具都有明确的权限边界，开发者可以实现细粒度的访问控制和参数验证，防止恶意使用或越权操作。系统还可以对工具调用频率、资源消耗等方面进行限制，确保系统稳定性。
灵活性与扩展性：
开发者可以轻松定义新工具并立即使大模型能够使用它们，无需重新训练模型。工具系统支持各种复杂数据类型、异步操作和嵌套调用，能够满足不同场景的需求。框架提供了多层扩展点，允许自定义参数转换、结果处理和错误恢复策略。
无缝集成：
Spring AI的工具调用系统与Spring生态深度集成，可以直接利用已有的服务、组件和配置。通过简单注解，现有业务逻辑立即变成AI可调用的能力，大大减少了集成成本。系统支持事务管理、缓存、安全和监控等企业级特性，使AI功能能够无缝融入现有应用架构。
开发效率：
注解驱动的编程模型极大简化了开发流程，减少了模板代码和手动配置。开发者可以专注于业务逻辑实现，而不必担心底层通信和协议细节。框架提供了丰富的调试和测试支持，帮助开发者快速识别和解决问题。
可观测性：
系统内置了全面的日志、指标和追踪机制，使开发者能够清晰了解每次工具调用的完整过程。这些信息对于调试复杂问题、优化性能和审计系统行为至关重要，同时也为后续的功能改进提供了数据支持。