当前位置：首页 > news >正文

【RAG】知识库问答不是只有 RAG

news 2025/9/19 10:27:21

“知识库问答（KB QA）”是一类能力/产品形态；RAG（检索增强生成）只是它的一种实现路线。
在工程上，往往是“多策略并存 + 智能路由”，绝不是“RAG 一把梭”。

1. 什么是“知识库问答”？

把“企业内的已知知识”（制度、SOP、手册、方案、报表、FAQ、知识图谱、业务 API 等）转成机器可检索/可调用的形态，当用户提问时，系统在权限范围内给出可追溯的答案。

关键目标：准确（口径一致）｜可溯源（有引用/SQL/接口记录）｜可维护（知识更新不必重训）｜可控（权限与审计）。

2. 常见实现谱系（RAG 只是其中之一）

规则/FAQ 精确匹配
- 关键词或向量最近邻直返固定答案。
- 适合：高频、口径固化的问答（如“节假日值班制度”）。
语义搜索 + 片段直返（不生成）
- 召回最相关段落，直接展示原文与出处。
- 适合：要“一字不差”的条款、编号、公式。
抽取式 QA（Extractive QA）
- BERT 类阅读理解模型在给定段落中抠出答案。
- 适合：问句答案位于短文本片段内。
RAG：检索 →（可选重排）→ 生成
- 先找“候选片段”，再让大模型基于引用组织答案并标注来源。
- 适合：跨文档总结、对比、串流程说明。
Text-to-SQL / API 工具调用
- 把问题翻译成 SQL/接口调用，查询结构化库，再生成自然语言解释。
- 适合：指标、清单、台账类问答（如“8 月煤耗同比”）。
知识图谱问答（KG QA）
- 在图上做实体/关系推理，返回确定性结论。
- 适合：实体间规则明确、链路可解释。

工程实践：多策略共存，由“意图路由器”决定走哪条路。

3. 选型口诀（把问题送对路）

文档条款要原文：→ 片段直返 / 抽取式 QA
跨文档归纳要解释：→ RAG
数字/报表要准：→ Text-to-SQL / API
高频标准答要稳：→ FAQ/规则
实体规则推理：→ KG QA

简易路由示意

[用户问题]↓（意图识别+权限判断）┌─────────────┬───────────────┬──────────────┬─────────┐FAQ/规则     片段直返/抽取    RAG（检索→生成）    SQL/API└─────────────┴───────────────┴──────────────┴─────────┘↓（统一返回层：答案 + 引用/SQL/接口日志）

4. 如果选 RAG，该怎么把“检索”做对？

分块（Chunking）：中文常用 600–900 字、重叠 80–120 字；优先按标题/标点切，减少断句。
混合检索：向量（语义） + BM25（关键词/编号） 互补；中文场景提升明显。
交叉重排（Re-rank）：用更强的二分类模型对“问句—片段”配对打分，显著提升前列质量。
查询重写：多轮对话把“它/那条标准/这个设备”补全成明确实体，检索更稳。
强约束提示：要求“大模型仅基于引用回答；找不到就说找不到；必须标注[1][2]引用”。

5. 权限与合规（务必前置）

检索前置过滤：只能在有权限的文档集合里搜索，避免“先泄露再遮羞”。
溯源与留痕：返回引用编号/SQL/接口日志；审计记录“谁在何时查了什么”。
脱敏与水印：对敏感字段做可逆/不可逆脱敏，结果页打水印与过期策略。

6. 评测与迭代：看 5 件事

准确率：答案是否正确、符合口径；
覆盖率：在评测集能答出的比例；
引用命中率：答案是否引用了包含关键信息的片段；
幻觉率：凭空编造的比例；
性能/成本：P95 时延、QPS、召回/重排/生成各阶段耗时与花费。

落地建议：用真实问题做 100–300 条评测集，持续 A/B（如“只向量 vs 混合检索”、“有无重排”、“RAG vs 片段直返”）。

7. 能源/政企类典型问题如何路由（示例）

“两票制度第 5.3 条是什么？” → 片段直返/抽取式（给原文和出处）
“检修工作票与巡检流程差异？” → RAG（跨文档对比 + 引用）
“8 月焦炉煤气消耗率同比？” → Text-to-SQL（返回数值 + SQL 溯源）
“设备 ABC-123 的备件编码和供应商？” → API/ERP 查询（可辅以 RAG 解释）

8. 快速落地的 5 步（团队最小闭环）

聚焦一个域（如“设备台账”或“招采 FAQ”），整理成 .md/.txt；
索引与检索：混合检索（向量+B M25）+ 交叉重排；
统一返回层：答案 + 引用（或 SQL/API 记录）；
权限前置 + 审计日志；
反馈回流：一键把“坏例子”沉淀进评测集与召回词库。

9. 常见误区（避坑清单）

只用向量、不做 BM25 → 编号/术语/公式命中差。
分块过大 → 命中稀释、时延变高；过小 → 语义断裂。
只做 RAG、不做 SQL/API → 数字问题答不准还贵。
权限后置 → 生成阶段再过滤已太晚。
不贴引用/SQL → 用户无法复核，信任感差。

10. 一句话总结

知识库问答是“多策略工具箱”，RAG 是其中一把强力扳手。
把“意图路由—检索/查询—可溯源返回—权限审计”这条主干走稳，比单点模型堆料更重要。

http://www.dtcms.com/a/389935.html

相关文章：

前端缓存深度解析：localStorage 到底是同步还是异步？

Vue2 基础知识点二：事件绑定 (Event Binding)

[硬件电路-250]：LDO电源核心指标、典型问题与工程实践指南

论文笔记（九十二）RLVR-World: Training World Models with Reinforcement Learning

驾校培训办公管理系统专属驾校的OA系统驾培管理行业

绿色纺织品的国际通行证：GRS认证的深度解析

如何解决 pip install 安装报错 ModuleNotFoundError: No module named ‘cryptography’ 问题

Linux网络：应用层http

基于GeoDa与R语言的空间数据回归实践技术应用

硅基计划3.0 学习总结反射枚举Lambada表达式

创作一个简单的编程语言2 ，开始增加中文关键字的功能

AI之EBT：《Energy-Based Transformers are Scalable Learners and Thinkers》的翻译与解读

UU远程听劝升级，防窥、远程协助更贴心

B站韩顺平笔记（Day 26 - 27）

FTP传输替代方案：告别传统，迎接新时期高效安全的文件传输

多层感知机（MLP）入门：从感知机到深度神经网络的关键一步

工业级边缘计算网关-动环监控解决方案

时空预测论文分享：机器学习+物理约束

Java 网络编程（二） --- TCP的socket的api

.NET 中使用Swagger 实现 API 分组管理

C++面试突击（2）

2025年生物信息学与大数据国际会议（ICBBD 2025）

R 语言入门实战｜第八章 S3 系统：用面向对象思维美化“老虎机”输出

SpringBoot自定义配置实战原理深层解析

cef：浏览器和渲染

EasyClick JavaScript 函数

Qt QSplineSeries详解

扩散模型简介

[答疑]SysML模型的BDD中加了新的端口，怎样同步到IBD

MySQL 专题（二）：索引原理与优化