当前位置: 首页 > news >正文

Mem0:构建具有可扩展长期记忆的生产级AI代理 - 论文学习总结2

一、研究背景

大语言模型(LLM)的上下文窗口长度有限,难以在持续多日的对话中保持事实一致性。现有 RAG、全上下文或商业记忆平台要么噪声大、要么延迟高、要么 token 开销爆炸。本文提出两种互补的记忆架构——Mem0Mem0g,在 LOCOMO 长程对话基准上同时实现更高精度、更低延迟、更小 token 占用,并支持即插即用部署。


二、方法总览

架构核心思想记忆形式适用场景
Mem0增量提取-更新-召回稠密自然语言事实文本片段 + 向量索引单跳 / 多跳快速查询
Mem0g在 Mem0 基础上增加图记忆实体为节点、关系为边、带时间戳时序推理 / 开放域知识融合

关键技术

  1. 双阶段流水线
    • 抽取阶段:用 LLM 从最新消息对中提炼事实集合 Ω;
    • 更新阶段:以语义向量召回相似记忆,由 LLM 判断执行 ADD / UPDATE / DELETE / NOOP,保证一致性与去重。
  2. 图构建与冲突解决:关系三元组 (vs, r, vd) 实时建图;出现矛盾时旧边标记失效而非删除,支持时序回溯。
  3. 双重检索:实体中心子图扩展 + 全局三元组语义向量匹配,兼顾精准与泛化。
  4. 工程优化:异步摘要刷新、动态精筛召回、Neo4j 存储 + GPT-4o-mini 生成,实现秒级可用。

三、实验设置

数据集:LOCOMO(10 条超长对话×平均 26 k tokens×200 问/条),题型分单跳、多跳、时序、开放域。
指标

  • 性能:F1、BLEU-1、LLM-as-a-Judge(J,10 次平均);
  • 部署:搜索延迟、总延迟 p50/p95、上下文 token 数。
    基线:官方榜 5 个、开源 LangMem、Zep 商业平台、RAG(128–8192 tokens, k=1/2)、全上下文 26 k、OpenAI 记忆特权模式。

四、主要结果

1. 精度(J 分)
题型原最佳Mem0Mem0g相对提升
单跳62.567.166.8+5%
多跳46.151.250.4+11%
时序52.355.558.1+11%
开放域76.6*(Zep)72.975.7追平差距 <1pp

*Zep 领跑开放域,但 Mem0g 紧随其后,验证结构化记忆与外部知识接口高度兼容。

2. 延迟
  • 搜索 p95:Mem0 0.20 s,Mem0g 0.48 s,均低于任何记忆对手;
  • 总 p95:Mem0 1.44 s(较全上下文↓92%),Mem0g 2.6 s(↓85%);
  • 全上下文 17 s,RAG 8 k-2chunk 约 12–15 s,难以满足实时交互。
3. Token 与存储
  • 每对话平均记忆大小:Mem0 7 k,Mem0g 14 k,Zep 高达 600 k(冗余摘要+边缓存);
  • Mem0/Mem0g 构建完成 <1 min 即可查询;Zep 需异步后台小时级索引,实时性不足。

五、结论

Mem0 与 Mem0g 以**“先压缩-再结构化”**的新范式,打破“长对话必须长上下文”的假设:

  • 在关键题型上平均提升 5–11%,同时把延迟压到原来的 1/10;
  • token 占用比商业方案少两个数量级,立等可用;
  • 形成“极速文本记忆 + 关系图记忆”工具链,可按场景灵活插拔。

六、未来工作

  1. 优化图遍历与并行化,进一步削减 Mem0g 延迟;
  2. 探索分层记忆(短时-长时- episodic)自动折中效率与表达力;
  3. 引入类脑巩固与遗忘机制,实现自适应生命周期管理
  4. 扩展至程序推理、多模态交互等更广阔任务,验证通用性。

通过解决上下文长度这一核心瓶颈,本研究使对话 AI 首次具备持续数日乃至数周、连贯且低成本的类人交互能力,为下一代持久智能体奠定坚实基础。

参考

https://arxiv.org/pdf/2504.19413

http://www.dtcms.com/a/533477.html

相关文章:

  • 手机网站如何建立c语言怎么做网站
  • [特殊字符] 通俗易懂:Kubernetes命名空间(Namespaces)详解
  • 科技期刊网站建设企业网站需要哪些功能
  • 第五章:清晰篇 - 语音前端处理:从嘈杂环境中捕捉纯净人声
  • 神经学习(4)神经网络的向量化实现与TensorFlow训练流程
  • 用php做的网站用什么数据库网络营销的盈利模式
  • 2005 年真题配套词汇单词笔记(考研真相)
  • 怎么用网网站模板做网站博客移植wordpress
  • AutoSAR实战教程--英飞凌MCAL/ETH Driver移植LwIP以太网协议栈(Tc3XX系列)
  • 外出手痒怎么玩家里游戏?手机用UU远程玩家中电脑游戏
  • 林州网站建设公司个人域名备案后不能干什么
  • 网站泛目录怎么做网站建设中图片尺寸
  • SAP交货单过账接口(无批次)分享
  • CCF-GESP 等级考试 2024年3月认证C++四级真题解析
  • C++ 类的学习(五) 友元成员
  • 哪里做网站最便宜微信开发者工具下载官网下载
  • SpringBoot—配置文件分类 文件基本(数据)格式 获取数据 profile 内部(外部)配置顺序
  • 大做网站免费人脉推广
  • 手机模板的网站深圳营销网站
  • 第十一章:跃迁篇 - 集成 MCP,连接能力宇宙
  • 建设制作网站wordpress数据表格
  • 建立网站多少钱一年phpmyadmin做网站
  • html5网站布局教程网站建设座谈会上的发言
  • 【补题】 Codeforces Round 1039 (Div. 2) D. Sum of LDS
  • 自建站怎么接入支付个人买卖网站如何做
  • Linux小课堂: systemd核心功能详解
  • 专做网站wordpress 图像滑块插件
  • 郑州知名做网站中国市场网
  • 【技术深度】腾讯 IM 接入规范文档(基于区块链交易所 APP)
  • 什么是区块链?有哪些场景需要用到?