当前位置: 首页 > news >正文

[Tongyi] 工具集成 | run_react_infer

第3章:工具集成

欢迎回来

在第1章:通义深度研究模型中,我们认识了项目的"大脑"——超级智能的通义深度研究模型。接着在第2章:智能代理搜索范式中,我们学习了这个大脑如何像数字侦探一样工作,遵循"决策-动作-观察"循环来解决复杂问题。

现在想象我们的数字侦探接到了一个案件,但它需要特殊装备来收集线索——比如观察细节的放大镜、导航用的地图,或是打开加密信息的工具包。

这就是工具集成的用武之地,它旨在为我们的智能代理提供正确的"装备",使其能够与自身知识库之外的现实世界互动

工具集成解决什么问题?

我们的通义深度研究模型非常聪明且知识渊博,因为它基于海量文本训练。但即使最聪明的大脑也有局限:

  1. 信息过时:它的知识基于最后一次训练时的数据。不知道昨天的新闻、当前股价或最新科学发现。
  2. 缺乏特定动作:它能生成文本,但不能执行诸如浏览网页、复杂计算或读取刚上传的PDF文档等操作。
  3. 无法与现实世界互动:除非提供连接外部系统的方式,否则它生活在数字真空中。

用例示例:深度研究如何查找巴黎当前天气,或阅读上周发表的特定PDF研究论文?它的内部训练数据不会有这些信息。

这正是工具集成要解决的问题。它为深度研究代理提供外部功能,使其能够执行需要最新信息或特定现实世界动作的任务

什么是工具?(代理的瑞士军刀)

工具视为深度研究代理的专用扩展或插件。它们就像是代理的瑞士军刀,每项功能都针对特定用途设计:

  • 网络搜索:在互联网上查找最新信息(如"巴黎当前天气")
  • 计算器:精确执行数学运算(如"345,678的15%是多少?")
  • 文件解析器:读取并提取本地文档中的信息(如PDF研究论文)
  • API集成:连接特定在线服务(目前我们先简化处理)

这些工具使代理不仅能回忆记忆中的信息,还能主动交互现实世界。

工具为何如此重要?

工具至关重要,因为它们:

  1. 提供新鲜信息:让代理直接从源头获取实时最新数据(如搜索引擎获取当前事件)
  2. 实现复杂动作:使代理能执行纯语言模型无法完成的操作(如复杂数学运算、读取特定文件)
  3. 提高准确性和可靠性:通过专用工具,代理能从可靠来源获取事实答案,而非仅依赖可能过时的内部知识
  4. 扩展能力:将代理从单纯的"讲述者"转变为"执行者",使其成为更强大、多用途的研究助手

代理如何使用工具?(决策过程)

最神奇的部分在于,我们的通义深度研究模型(大脑)不仅拥有这些工具,还能智能决定何时使用哪个工具。这种决策是我们在智能代理搜索范式章节讨论的"决策->动作->观察"循环的一部分。

面对问题时,代理的内部思考过程可能是这样的:

  1. 思考:“要回答这个问题,我需要训练数据中没有的信息,或者需要执行特定动作”
  2. 决策:“哪个工具最适合这个任务?”
  3. 动作:“我将调用web_search工具执行特定查询”
  4. 观察:“这是web_search工具返回的结果”
  5. 下一步思考:“基于这些结果,我接下来该做什么?”

在深度研究中设置工具(解决用例)

深度研究项目使得启用和配置这些工具非常简单。通常通过编辑run_react_infer.sh等配置脚本来实现,该脚本告诉深度研究系统有哪些可用工具以及如何访问它们。

我们来看看如何启用网络搜索工具并准备文件解析器,使用run_react_infer.sh脚本中的片段(如README.md和第1章所述)。

# --- 网络搜索工具配置 ---
# 要启用网络搜索,通常需要从搜索提供商处获取API密钥
# 这个密钥允许深度研究代理与搜索引擎"对话"
# 如果WEB_SEARCH_API_KEY为空,则不会使用网络搜索工具
export WEB_SEARCH_API_KEY="YOUR_GOOGLE_SEARCH_API_KEY_HERE"
export WEB_SEARCH_ENGINE_ID="YOUR_GOOGLE_SEARCH_ENGINE_ID_HERE"# --- 文件解析器工具配置 ---
# 文件解析器允许代理读取本地文档
# 通常不需要API密钥,但需要启用
export FILE_PARSER_ENABLED="True"# 其他工具可能有类似设置
# ...(其他脚本配置)...# 运行推理脚本时,它将使用模型和启用的工具:
bash run_react_infer.sh

说明

  • WEB_SEARCH_API_KEYWEB_SEARCH_ENGINE_ID:这些行对网络搜索工具至关重要。YOUR_GOOGLE_SEARCH_API_KEY_HERE是一个占位符,应替换为从Google自定义搜索API等服务获得的真实密钥。这个密钥就像密码,授予深度研究执行搜索的权限。没有它,代理无法使用网络搜索工具。
  • FILE_PARSER_ENABLED="True":这简单地"打开"文件解析器工具。如果是"False",代理将无法读取本地文件。

通过设置这些环境变量,你实际上是在给深度研究代理递上网络搜索"放大镜",并告诉它"文件阅读笔记本"已备好。

内部机制:工具使用流程

当你提出需要工具的问题时,以下是简化的执行顺序:

在这里插入图片描述

流程说明

  1. 用户提出需要外部信息和动作的问题
  2. 深度研究应用将其发送给通义模型
  3. 通义模型思考(作为智能代理搜索范式的一部分)。它意识到需要当前天气,于是决定使用网络搜索工具
  4. 通义模型然后以特定格式生成一个动作(如web_search(query="weather Paris")
  5. 深度研究应用(协调工具的部分)看到这个动作,实际调用网络搜索工具查询"weather Paris"
  6. 网络搜索工具执行搜索并返回观察结果(搜索结果/当前天气)给通义模型
  7. 通义模型处理这个观察。再次思考后决定下一个动作是使用文件解析工具读取"document.pdf"
  8. 这个循环持续进行,直到通义模型收集到所有必要信息并决定可以提供全面答案

关键在于通义模型充当导演角色,在研究过程的每一步选择使用瑞士军刀中的哪个"工具"。

常见深度研究工具

以下是深度研究(及类似代理系统)可以集成的常见工具类型:

工具类型功能描述用例示例需要配置
网络搜索访问互联网查找最新信息“昨天新闻的头条是什么?”API密钥
计算器执行精确数学计算“计算587的平方根,然后乘以23”无需
文件解析器读取并提取本地文档内容“总结’report.pdf’中的关键发现”启用/路径
数据库查询与结构化数据库(如SQL)交互“查找上月订购产品X的所有客户”连接详情
API调用器连接特定外部服务/API“获取AAPL的最新股价”API密钥,端点

如你所见,每种工具都提供独特功能,极大地扩展了深度研究代理的能力范围。

总结

在本章中,我们解锁了深度研究中工具集成的力量

我们了解到工具是外部功能——就像瑞士军刀——赋予通义深度研究模型获取实时信息、执行特定动作并与自身知识库之外的现实世界互动的能力。这使得我们的深度研究代理在回答复杂、最新的问题时异常灵活,因为它能智能地决定在智能代理搜索范式的"决策-动作-观察"循环中使用哪个工具。

你也看到了这些工具通常如何通过run_react_infer.sh等脚本中的简单设置来启用和配置,通常需要外部服务的API密钥。

接下来,我们将深入探讨深度研究代理实际运行其思考和行动过程的不同方式,探索各种**推理执行模式**。

http://www.dtcms.com/a/461659.html

相关文章:

  • 做课题查新网站茶叶网站开发目的和意义
  • 第5章 高效的多线程日志
  • 平安建设 十户长网站地址织梦网站制作教程
  • 无人机图传系统解析:模拟与数字的应用及未来趋势,无人机图传的作用
  • Agentic AI 与 AI 编程入门:让 AI 成为学习与创作的最佳伴侣
  • CF45C Dancing Lessons 题解
  • Docker 容器 -- 编写你的第一个 Dockerfile
  • 做的好的网站开发网站空间200m
  • 虚拟机怎么做网站上海做网站天锐
  • 网站优化要怎么做才会做到最佳百度站长统计
  • ALV 单元格控制案例
  • 网站被墙 做301跳转服务器正常网站打不开
  • maven mvn 安装自定义 jar 包
  • Flink 广播状态(Broadcast State)实战从原理到落地
  • 苏州市吴江区住房和城乡建设局网站网站开发的项目开发
  • 基于MBSE的系统设计和流程合规实例
  • 【文件读写】18,21关
  • Turbopack vs Webpack vs Vite:前端构建工具三分天下,谁将胜出?
  • 如何外贸网站推广网站建设与管理试题及答案
  • 广州建网站维护公司wordpress 手机不显示内容
  • 水位流量在线监测装置:精准监测与智能管理的科技基石
  • mac下解压jar包
  • 收费网站怎么制作山东省建设执业资格注册管理中心网站
  • 腾讯云网络vpc之arping返回MAC一样问题
  • 网站建设网页设计案例网站开发的外文文献
  • 西安优化网站推广宁波做网站排名的公司有哪些
  • 库、编译器有一个错误:undefined reference to `stat64@GLIBC_2.33‘
  • npm uninstall 执行的操作、有时不会删除 node_modules 下对应的文件夹
  • Unity网络开发--套接字Socket(2)
  • 大学网站建设技术方案wordpress 评论优化