当前位置: 首页 > news >正文

谷歌推出Vertex AI Memory Bank:为AI智能体带来持久记忆,支持连续对话

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

AI智能体正逐步走向商业化,但“缺乏记忆”长期以来一直是开发中的核心难题。当前许多AI智能体无法记住用户的历史互动,导致每次对话都被视为首次交流。这种缺陷带来了重复提问、忽略用户偏好、缺乏个性化等问题,不仅让用户感到沮丧,也给开发者带来极大挑战。

过去,开发者尝试通过将整段对话历史直接注入大语言模型(LLM)的上下文窗口来解决这一问题,但这种方法计算成本高昂,响应速度变慢,且容易导致模型输出质量下降。例如,加入过多无关信息容易引发“中间信息丢失”(lost in the middle)或“上下文腐烂”(context rot)等现象。

Vertex AI Memory Bank正式发布

为突破上述瓶颈,谷歌云宣布在Vertex AI Agent Engine中推出Memory Bank服务的公开预览版本。这是一项全托管的新型服务,旨在帮助开发者构建具备持久记忆能力的个性化对话智能体,使互动更加自然、连贯并具备上下文感知能力。

例如,在医疗健康场景中,某用户曾在以往会话中提及过敏史或某些症状,Memory Bank能够让智能体在当前对话中准确调用这些信息,从而提供更贴合用户实际情况的建议。

Memory Bank的关键优势包括:

  • 个性化互动:智能体能够记住用户偏好、重要事件和历史选择,突破剧本式应答模式,真正实现“因人而异”。
  • 保持对话连续性:即便跨越数日或数周,智能体也能无缝衔接之前的对话内容,避免“记忆断层”。
  • 提供更佳上下文:对用户背景信息的掌握,使AI响应更具洞察力、相关性和实用性。
  • 提升用户体验:避免用户重复输入相同信息,让交流更加自然高效,提升整体满意度。

工作原理解析

Memory Bank依托谷歌Gemini模型与最新研究成果,采用多阶段智能处理流程实现对“记忆”的构建与应用:

  1. 理解与提取记忆
    Memory Bank会异步分析用户在Agent Engine Sessions中的历史对话,从中提取关键事实、偏好与上下文信息。这一过程无需开发者自建复杂的提取流程,由系统自动完成。
  2. 智能存储与更新记忆
    提取的信息(如“我喜欢阳光明媚的天气”)按作用域(如用户ID)分类存储。当有新信息出现时,Memory Bank会使用Gemini模型将其与已有记忆融合,解决潜在矛盾,确保数据始终准确、最新。
  3. 召回相关信息
    在新的对话会话开始时,智能体可以调用这些记忆。调用方式可以是直接检索全部信息,也可以通过嵌入向量进行相似性搜索,优先提取与当前主题最相关的记忆,从而为智能体提供精准上下文支持。

该流程基于谷歌研究团队发表于ACL 2025的最新研究方法,采用主题导向的学习与召回机制,为智能体记忆功能树立了行业新标准。例如,个性化美容助手可以根据用户不断变化的肤质,精准推荐合适的护肤产品。

如何使用Memory Bank

Memory Bank已集成至谷歌的Agent Development Kit(ADK)与Agent Engine Sessions之中。开发者只需使用ADK定义智能体,并启用Agent Engine Sessions,即可自动管理每次会话的历史数据。而Memory Bank的接入则进一步实现跨会话的长期记忆。

开发者可通过以下两种主要方式接入Memory Bank:

  1. 使用ADK构建智能体:提供开箱即用的集成体验,适合希望快速部署的用户。
  2. API方式调用Memory Bank:若智能体通过其他框架构建(如LangGraph或CrewAI),也可通过API接口集成Memory Bank功能。

对于首次使用谷歌云的开发者,ADK支持快捷注册模式。用户可使用Gmail账户注册Agent Engine Sessions与Memory Bank,获取API密钥并在免费额度内构建原型项目,后续也可无缝迁移至完整的谷歌云项目用于生产部署。

Memory Bank的发布标志着AI智能体进入真正具备“记忆力”的新阶段,为构建更智能、更人性化的AI交互系统奠定了坚实基础。

http://www.dtcms.com/a/277103.html

相关文章:

  • 【源力觉醒 创作者计划】文心开源大模型ERNIE-4.5私有化部署保姆级教程与多功能界面窗口部署
  • zotero自由编辑参考文献格式(2)
  • Dubbo + Spring Boot + Zookeeper 快速搭建分布式服务
  • spring--xml注入时bean的property属性
  • 20250713-`Seaborn.pairplot` 的使用注意事项
  • jenkins部署前端vue项目使用Docker+Jenkinsfile方式
  • 【PTA数据结构 | C语言版】字符串插入操作
  • java.net.InetAddress
  • 学习笔记-Excel统计分析——描述统计量的计算
  • SpringBoot单元测试类拿不到bean报空指针异常
  • 算法 - 蛇形矩阵-上三角
  • 2.3 单链表的应用
  • 图像读取与模型保存--基于NWPU-RESISC45数据集的图像二分类实战
  • stm32f103c8t6移植freeRTOS内存不足报错问题的解决办法
  • 浏览器渲染原理与性能优化全解析
  • 快速傅里叶变换(FFT)中的振幅和相位
  • 【计算机网络架构】环型架构简介
  • 在 C# 中调用 Python 脚本:实现跨语言功能集成
  • ADB 调试日志全攻略:如何开启与关闭 `ADB_TRACE` 日志
  • CS课程项目设计1:交互友好的井字棋游戏
  • 详解Linux下多进程与多线程通信(二)
  • 【QT】使用QSS进行界面美化
  • 异或为什么叫异或
  • 【读书笔记】《Effective Modern C++》第3章 Moving to Modern C++
  • Datawhale AI夏令营——基于带货视频评论的用户洞察挑战赛
  • 【PTA数据结构 | C语言版】简单计算器
  • 17.使用DenseNet网络进行Fashion-Mnist分类
  • LabVIEW调用外部DLL
  • 深度学习图像分类数据集—七种树叶识别分类
  • 零基础 “入坑” Java--- 十、继承