当前位置: 首页 > news >正文

AutoGen学习笔记系列(十二)Advanced - Memory

这篇文章瞄的是AutoGen官方教学文档 Advanced 章节中的 Memory 篇章,介绍了如何将外部知识添加进 Team或Agent中以实现RAG功能。

  • 官网链接:https://microsoft.github.io/autogen/stable/user-guide/agentchat-user-guide/memory.html ;

【注意】:本文的Memory可以被翻译成“知识库”,但这里为了和专家系统进行区分就翻译成“记忆体”了;


Memory

对于一个Team或者Agent而言维护一些有价值的知识 facts 能够更好的让其开展工作,因为他们能够在合适的时间将这些知识添加到上下文中。最经典的使用实例就是 Retrieval-Augmented Generation (RAG),即检索增强生成,是一种结合了 信息检索文本生成 的技术,主要用于提升LLM在生成文本时的准确性和相关性。

RAG 的核心思想是:在生成文本之前,先从外部知识库或文档中检索相关信息,然后将检索到的信息给LLM生成更准确、更有依据的答案。这种方法特别适合 需要基于事实或特定领域知识的任务。有点类似于构建了一个 小型或临时 的专家系统,但与专家系统之间存在本质区别:

RAG专家系统
目标动态生成准确、相关的文本模拟专家决策,解决特定领域问题
知识来源外部动态检索手工构建的知识库
灵活性高,适用于开放领域低,适用于封闭领域
输出特性概率性,可能存在幻觉确定性,基于规则推理
技术实现深度学习 + 检索技术规则引擎 + 符号推理
应用场景问答、内容生成、开放领域任务诊断、决策支持、封闭领域任务

关于RAG和专家系统之间的差异这里就不再过多赘述,感兴趣的可以自己去查看相关文献。

AutoGen库提供了一个 Memory 协议以提供以下功能,其核心方法是 queryupdate_contextaddclear以及close

  • add:向记忆中添加新的知识;
  • query:从记忆中检索相关知识;
  • update_context:通过添加检索到的知识来修改Agent内部的上下文信息 model_context
  • clear:清空记忆中的所有知识;
  • close:清空记忆中的所有知识并回收资源;

ListMemory Example

微软提供了一个基于 ListMemory 对象的记忆体并按照时间关系来维护,能够将近期的记忆添加到模型的上下文中,你可以将其看作是一个 list 数组。该对象被设计成明确且直接可用的,因为list中的内容本身就是你新增的知识,而不是LLM生成的。

from autogen_agentchat.agents import AssistantAgent
from autogen_agentchat.ui import Console
from autogen_core.memory import ListMemory, MemoryContent, MemoryMimeType
from autogen_ext.models.openai import OpenAIChatCompletionClient

import os, asyncio

os.environ["OPENAI_API_KEY"] = "你的OpenAI API Key"

#------------------------------------------------------------#
# Step1. 创建一个 ListMemory 对象
user_memory = ListMemory()

#------------------------------------------------------------#
# Step2. 手动添加一些知识给 ListMemory 对象
# 		 1. 天气的返回信息必须是公制单位
#		 2. 食谱必须是素食;
async def user_memory_add():
    await user_memory.add(MemoryContent(content="The weather should be in metric units", mime_type=MemoryMimeType.TEXT))
    await user_memory.add(MemoryContent(content="Meal recipe must be vegan", mime_type=MemoryMimeType.TEXT))

#------------------------------------------------------------#
# Step3. 定义一个用来获取天气的工具tool
async def get_weather(city: str, units: str = "imperial") -> str:
    if units == "imperial":
        return f"The weather in {city} is 73 °F and Sunny."
    elif units == "metric":
        return f"The weather in {city} is 23 °C and Sunny."
    else:
        return f"Sorry, I don't know the weather in {city}."

#------------------------------------------------------------#
# Step4. 创建Agent
assistant_agent = AssistantAgent(
    name="assistant_agent",
    model_client=OpenAIChatCompletionClient(
        model="gpt-4o-2024-08-06",
    ),
    tools=[get_weather],
    memory=[user_memory],
)

async def main():
	# 任务一:使用工具 get_weather 查询纽约天气
    await user_memory_add()
    stream = assistant_agent.run_stream(task="What is the weather in New York?")
    await Console(stream)
    print("-" * 50)
    message = await assistant_agent._model_context.get_messages()
    for item in message:
        print(item)
    print("-" * 50)
    # 任务二:向LLM进行轮询,要求写一个肉汤食谱
    stream = assistant_agent.run_stream(task="Write brief meal recipe with broth")
    await Console(stream)
    
asyncio.run(
    main()
)

运行结果如下,第一个任务:

$ python demo.py

在这里插入图片描述


【缺失库】Custom Memory Stores (Vector DBs, etc.)

除了上面用纯文本的方式添加记忆体意外,AutoGen也提供了使用向量或者ext文件的形式来添加记忆体中的内容,即你可以使用矢量数据库存储和检索信息,但需要对 add, query, update_context 这三个方法进行重载:

【注意】:对于我当前的AutoGen版本 0.4.7 而言,官网的demo在此处至少缺失一个库 chromadb,但文档中提示 autogen-ext 0.4.7 does not provide the extra 'memory',我后续将这个问题解决后再放上修改后的demo;

相关文章:

  • openai-cua-sample-app - 使用计算机的 Agent示例应用
  • 我与DeepSeek读《大型网站技术架构》(11)- 海量分布式存储系统Doris的高可用架构设计分析
  • ima 知识库,重新定义你的「成长加速器」
  • Github 2025-03-11 Python开源项目日报Top10
  • Bash和Zsh在处理大文件时差异
  • 设计模式C++
  • ArcGIS水文水资源水环境应用实战:从入门到精通!ArcGIS水文分析及流域特征提取;湖泊水库水环境监测及评价;河道水污染预测与水环境容量计算等
  • 《黑客攻防从入门到精通:工具篇》全15章万字深度总结——从工具解析到实战攻防,构建完整网络安全知识体系
  • Java 8 Stream 面试题
  • win32汇编环境,对 WM_MOUSEMOVE 消息的理解
  • 运维新手入门——线缆的使用(Beginner‘s Guide to Operations and Maintenance - Cable Usage)
  • 七大常用智能家居协议对比
  • Spring Boot + MySQL + MyBatis:企业级应用开发实战
  • 【 现代后端架构演进:微服务设计与云原生】
  • 012-Benchmark
  • csdn码字员的第2*2^10天
  • Android Retrofit 框架配置与构建模块深入源码分析(六)
  • 微软程序控制机制WDAC
  • 自动化的多线程实现
  • Spring中的对象创建与生命周期管理
  • 中国至越南河内国际道路运输线路正式开通
  • “一码难求”的Manus开放注册但价格不菲,智能体距离“实用”还有多远
  • 国产水陆两栖大飞机AG600批产首架机完成总装下线
  • 生态环境保护督察工作条例对督察对象和内容作了哪些规定?有关负责人答问
  • 打击网络谣言、共建清朗家园,中国互联网联合辟谣平台2025年4月辟谣榜
  • 百利天恒董事长向复旦捐赠三千万元,用于支持创新药物靶点发现等师资建设需要