当前位置: 首页 > news >正文

【每天一个知识点】CAG:Context-Augmented Generation

🧩 一、CAG:Context-Augmented Generation(上下文增强生成)

核心思想:

通过“外部或结构化上下文”的显式引入,提升大模型生成的语义准确性、连贯性与可控性。

它是对传统 RAG(Retrieval-Augmented Generation) 的扩展,关注的不只是“检索文本”,而是“如何高质量地组织、选择与利用上下文”。

🔹 核心流程

User Query → Context Construction → Context Selection & Fusion → LLM Generate

🔹 上下文来源

  • 🔸 检索式上下文(RAG)
    从知识库检索相似内容;

  • 🔸 聚类式上下文(Clustering-CAG)
    对知识库进行聚类或主题归纳;

  • 🔸 图式上下文(Graph-CAG)
    利用知识图谱构造关联上下文;

  • 🔸 语义记忆上下文(Memory-CAG)
    使用长期记忆结构动态提取上下文;

  • 🔸 对话上下文(Dialog-CAG)
    在多轮交互中复用历史语境。


⚙️ 二、RAG vs. CAG:从检索增强到上下文增强

对比项RAGCAG (Context-Augmented)
增强维度检索增强(Retrieval)上下文增强(Context)
核心目标引入外部知识,提高事实正确性引入多类型上下文,提高生成一致性与推理深度
输入形式Query + 检索到的Top-K文档Query + 聚合后的多源上下文(文本、图、摘要等)
典型机制向量检索 + 拼接上下文构建 + 筛选 + 融合(可含聚类、摘要、权重)
适用场景QA、知识问答、事实型任务复杂问答、决策推理、多轮对话、专业领域生成
上下文组织扁平式(无结构)结构化(聚类、图谱、主题记忆)
代表模型OpenAI RAG, LlamaIndex, LangChain RAGGraphRAG, ClusterRAG, Dynamic-Memory RAG, Context-Tuning

🧠 三、CAG 的关键增强技术

技术方向功能说明
上下文聚类 (Context Clustering)对知识库聚类,生成主题级上下文(CAG的早期变体)
上下文摘要 (Context Summarization)对相似文档进行压缩摘要,减少冗余与token占用
上下文选择 (Context Selection)利用注意力或重排序模型筛选最相关上下文
上下文融合 (Context Fusion)将多源上下文(文档、图谱、记忆)融合成统一输入
上下文记忆 (Context Memory)动态保存生成历史和用户意图,实现长程依赖

📊 四、关系总结图

        ┌──────────────┐│  RAG (Retrieval) │ →  检索增强└──────────────┘↓  演化┌──────────────────────┐│  CAG (Context) │ →  上下文增强└──────────────────────┘↙         ↓         ↘Clustering-CAG   Graph-CAG   Memory-CAG(聚类上下文)   (图结构上下文)   (记忆上下文)

📚 五、总结一句话

RAG 让模型“找到正确的信息”;
CAG 让模型“在正确的语境中理解与生成”。


http://www.dtcms.com/a/596430.html

相关文章:

  • 《Linux系统编程之系统导论》【冯诺依曼体系结构 + 操作系统基本概述】
  • 第23天python内容
  • 5.2、Python-字符串的编码和解码
  • 美容院网站源码网站流量下降的原因
  • FreeRTOS 学习:(十七)“外部中断”和“内核中断”的差异,引入 FreeRTOS 中断管理
  • CodeBuddy AI IDE :Skills 模式
  • 大模型学习计划(按周规划)
  • 绥中网站建设分类信息网网站500
  • k8s 部署MySQL 数据持久化
  • Quantinuum 发布新型量子计算机“Helios“
  • ubuntu/kali安装k8s
  • 开源 Objective-C IOS 应用开发(二)Xcode安装
  • 【论文阅读】Gradient Guidance for Diffusion Models:An Optimization Perspective
  • WebSocket调试工具(html),用于调试WebSocket链接是否畅通
  • Springboot3.X+security6.5+jdk21
  • 中文企业网站设计欣赏宁波网站建设方案联系方式
  • Vue2 入门到实战(day2):计算属性、监视属性、样式绑定与条件渲染(附代码案例)
  • C语言位运算深度应用:嵌入式硬件寄存器控制与低功耗优化实践
  • 深圳建立网站营销用动易建设网站教程
  • 京东后端架构技术,Pipline 设计 解决复杂查询逻辑
  • 《STM32 江湖 SPI 双绝:硬件外设与软件模拟的深度解析》
  • Docker学习笔记---day002
  • F280049C学习笔记之X-BAR
  • Python基础教学:Python的openpyxl和python-docx模块结合Excel和Word模板进行数据写入-由Deepseek产生
  • WebSocket原理及实现详解
  • 网站建设与管理吴振峰pptapp的制作需要多少钱
  • 优雅与极简:将你的屏幕变成复古翻页钟——Fliqlo for Mac 完全指南
  • wsl ubuntu24.04 cuda13 cudnn9 pytorch 显卡加速
  • macos安装mysql
  • 解决 iPhone 和 Mac 之间备忘录无法同步的9种方法