当前位置：首页 > news >正文

谷歌推出Vertex AI Memory Bank：为AI智能体带来持久记忆，支持连续对话

news 2025/7/14 6:05:38

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

AI智能体正逐步走向商业化，但“缺乏记忆”长期以来一直是开发中的核心难题。当前许多AI智能体无法记住用户的历史互动，导致每次对话都被视为首次交流。这种缺陷带来了重复提问、忽略用户偏好、缺乏个性化等问题，不仅让用户感到沮丧，也给开发者带来极大挑战。

过去，开发者尝试通过将整段对话历史直接注入大语言模型（LLM）的上下文窗口来解决这一问题，但这种方法计算成本高昂，响应速度变慢，且容易导致模型输出质量下降。例如，加入过多无关信息容易引发“中间信息丢失”（lost in the middle）或“上下文腐烂”（context rot）等现象。

Vertex AI Memory Bank正式发布

为突破上述瓶颈，谷歌云宣布在Vertex AI Agent Engine中推出Memory Bank服务的公开预览版本。这是一项全托管的新型服务，旨在帮助开发者构建具备持久记忆能力的个性化对话智能体，使互动更加自然、连贯并具备上下文感知能力。

例如，在医疗健康场景中，某用户曾在以往会话中提及过敏史或某些症状，Memory Bank能够让智能体在当前对话中准确调用这些信息，从而提供更贴合用户实际情况的建议。

Memory Bank的关键优势包括：

个性化互动：智能体能够记住用户偏好、重要事件和历史选择，突破剧本式应答模式，真正实现“因人而异”。
保持对话连续性：即便跨越数日或数周，智能体也能无缝衔接之前的对话内容，避免“记忆断层”。
提供更佳上下文：对用户背景信息的掌握，使AI响应更具洞察力、相关性和实用性。
提升用户体验：避免用户重复输入相同信息，让交流更加自然高效，提升整体满意度。

工作原理解析

Memory Bank依托谷歌Gemini模型与最新研究成果，采用多阶段智能处理流程实现对“记忆”的构建与应用：

理解与提取记忆
Memory Bank会异步分析用户在Agent Engine Sessions中的历史对话，从中提取关键事实、偏好与上下文信息。这一过程无需开发者自建复杂的提取流程，由系统自动完成。
智能存储与更新记忆
提取的信息（如“我喜欢阳光明媚的天气”）按作用域（如用户ID）分类存储。当有新信息出现时，Memory Bank会使用Gemini模型将其与已有记忆融合，解决潜在矛盾，确保数据始终准确、最新。
召回相关信息
在新的对话会话开始时，智能体可以调用这些记忆。调用方式可以是直接检索全部信息，也可以通过嵌入向量进行相似性搜索，优先提取与当前主题最相关的记忆，从而为智能体提供精准上下文支持。

该流程基于谷歌研究团队发表于ACL 2025的最新研究方法，采用主题导向的学习与召回机制，为智能体记忆功能树立了行业新标准。例如，个性化美容助手可以根据用户不断变化的肤质，精准推荐合适的护肤产品。

如何使用Memory Bank

Memory Bank已集成至谷歌的Agent Development Kit（ADK）与Agent Engine Sessions之中。开发者只需使用ADK定义智能体，并启用Agent Engine Sessions，即可自动管理每次会话的历史数据。而Memory Bank的接入则进一步实现跨会话的长期记忆。