当前位置：首页 > news >正文

智能体前沿-主动信息获取理论基础

news 2025/8/28 7:24:28

在智能体工具时代，随着集成工具越来越多，token消耗一直是应用优化难以回避的问题。

MCP-Zero基于主动信息获取理论优化，在保证性能前提下，明显减少了token消耗。

https://github.com/xfey/MCP-Zero

这里参考MCP-Zero网络资料，尝试探索智能体主动信息获取的相关理论。

1 最优工具选择

T = {t1, t2, …, tn}表示完整工具集合，q表示查询，st表示当前对话状态，t*表示最优工具选择。

1）被动方法

传统方法需要对整个集合进行评估：

$P_{passive}(t^{*}|q, T) = \frac{P(q|t^{*}, T)P(t*|T))}{\sum_{t_{i} \in T} P(q|t_{i}, T)P(t_{i}|T)}\displaystyle$

2）主动方法

采用主动信息获取，智能体根据其当前状态和能力评估生成请求 r

$P_{activte}(t^{*}|s_t) = P(t^{*}|r)P(r|s_t))$

P(r|st) 表示智能体根据当前理解表达其需求的能力。

2 工具请求

工具请求建模为一个主动学习过程，智能体选择以最大化任务完成信息增益为目标。

$\displaystyle r^{*} = \mathop{\arg\max}\limits_{r} I(T^{*}; r|s_{t}) = \mathop{\arg\max}\limits_{r} [H(T^{*}|s_{t}) - H(T^{*}|r, s_{t})]$

T*表示最优工具集

I(T*; r|st)表示最优工具集与请求之间的互信息

r*尝试让智能体主动减少工具需求不确定性。

3 语义对齐改进

相比原始用户查询q，智能体生成的请求r与工具文档表现出更强的对齐。

$Alignment(r, t) = cos(e_{r}, e_{t}) > cos(e_{q}, e_{t})$

e_r、e_q、e_t 分别表示请求、查询和工具描述的嵌入。

这种改进源于智能体与工具文档在相同的语义空间中操作。

4 迭代信息增益

与单次检索不同，主动发现支持k次迭代中累积信息获取增益。

$\displaystyle I_{total} = \sum_{i}^{k} I(T^{*}; r_{i}|s_{i-1}) - \lambda Cost(r_{i})$

λ 表示每次请求上下文开销，I_total捕捉了主动信息获取优化在信息增益和计算效率之间的权衡。

采用主动信息获取优化后，token消耗减少98%且准确性不变，反映了其相对于穷举工具的效率.

从搜索空间角度观察，被动方法处理所有n个工具，主动方法首先在n个服务器中过滤出m个服务器(m ≪ n)，然后在过滤后的子集中进行匹配，将复杂度降低到O(m + k)，其中 k 是每个选定服务器的平均工具数。

从注意力分布角度，在有限认知资源下，被动方法将注意力平均分配到每个工具上，每个工具的注意力为1/n，并受到噪声因子η(n) ∝ log(n)的影响。主动方法将注意力集中在相关子集上，保持 1/k 的有效性，其中 k ≪ n。

reference

---

MCP-Zero：LLM智能体主动工具发现的新范式

https://zhuanlan.zhihu.com/p/1928760473630798292

MCP-Zero: Active Tool Discovery for Autonomous LLM Agents

[2506.01056] MCP-Zero: Active Tool Discovery for Autonomous LLM Agents

MCP-Zero 论文官网

https://github.com/xfey/MCP-Zero

⚡️ MCP-ZERO ⚡️，与论文没有关系

https://github.com/GlobalSushrut/mcp-zero

查看全文

http://www.dtcms.com/a/353375.html

汇川SV660A 伺服EMC电源滤波的安装要求及使用方法

Swift 解法详解 LeetCode 364：嵌套列表加权和 II

【ConcurrentHashMap】实现原理和HashMap、Redis哈希的区别

【Linux网络】网络基础

如何高效地学习：从“死记硬背”到“内化创新”

第二章从事件驱动到信号

ESP32使用场景及大规模物联网IoT

【高级机器学习】3. Convex Optimisation

海康相机的 HB 模式功能详解

深入解析 OpenGL 着色器：顶点着色器与片段着色器

无人驾驶叉车的核心作用：技术赋能下如何重塑工业物流的运作逻辑

Chrome插件学习笔记（四）

豆包分析linux top

李飞飞谈 AI 世界模型：技术内涵与应用前景

深度学习——卷积神经网络CNN（原理：基本结构流程、卷积层、池化层、全连接层等）

编程算法实例-算法学习网站

[Mysql数据库] 知识点总结4

LeetCode热题 100——48. 旋转图像

CB1-3-面向对象

琼脂糖凝胶核酸电泳条带异常问题及解决方案汇总

Day29 基于fork+exec的minishell实现与pthread多线程

【Linux】基本指令学习3

IBMS集成管理系统与3D数字孪生智能服务系统的应用

Linux驱动 — 导出proc虚拟文件系统属性信息

LabVIEW 音频信号处理

【ElasticSearch】原理分析

opencv+yolov8n图像模型训练和推断完整代码

django注册app时两种方式比较

PyTorch图像预处理完全指南：从基础操作到GPU加速实战

jQuery版EasyUI的ComboBox（下拉列表框）问题

相关文章：