【RAG】知识库问答不是只有 RAG
“知识库问答(KB QA)”是一类能力/产品形态;RAG(检索增强生成)只是它的一种实现路线。
在工程上,往往是“多策略并存 + 智能路由”,绝不是“RAG 一把梭”。
1. 什么是“知识库问答”?
把“企业内的已知知识”(制度、SOP、手册、方案、报表、FAQ、知识图谱、业务 API 等)转成机器可检索/可调用的形态,当用户提问时,系统在权限范围内给出可追溯的答案。
关键目标:准确(口径一致)|可溯源(有引用/SQL/接口记录)|可维护(知识更新不必重训)|可控(权限与审计)。
2. 常见实现谱系(RAG 只是其中之一)
规则/FAQ 精确匹配
关键词或向量最近邻直返固定答案。
适合:高频、口径固化的问答(如“节假日值班制度”)。
语义搜索 + 片段直返(不生成)
召回最相关段落,直接展示原文与出处。
适合:要“一字不差”的条款、编号、公式。
抽取式 QA(Extractive QA)
BERT 类阅读理解模型在给定段落中抠出答案。
适合:问句答案位于短文本片段内。
RAG:检索 →(可选重排)→ 生成
先找“候选片段”,再让大模型基于引用组织答案并标注来源。
适合:跨文档总结、对比、串流程说明。
Text-to-SQL / API 工具调用
把问题翻译成 SQL/接口调用,查询结构化库,再生成自然语言解释。
适合:指标、清单、台账类问答(如“8 月煤耗同比”)。
知识图谱问答(KG QA)
在图上做实体/关系推理,返回确定性结论。
适合:实体间规则明确、链路可解释。
工程实践:多策略共存,由“意图路由器”决定走哪条路。
3. 选型口诀(把问题送对路)
文档条款要原文:→ 片段直返 / 抽取式 QA
跨文档归纳要解释:→ RAG
数字/报表要准:→ Text-to-SQL / API
高频标准答要稳:→ FAQ/规则
实体规则推理:→ KG QA
简易路由示意
[用户问题]↓(意图识别+权限判断)┌─────────────┬───────────────┬──────────────┬─────────┐FAQ/规则 片段直返/抽取 RAG(检索→生成) SQL/API└─────────────┴───────────────┴──────────────┴─────────┘↓(统一返回层:答案 + 引用/SQL/接口日志)
4. 如果选 RAG,该怎么把“检索”做对?
分块(Chunking):中文常用 600–900 字、重叠 80–120 字;优先按标题/标点切,减少断句。
混合检索:向量(语义) + BM25(关键词/编号) 互补;中文场景提升明显。
交叉重排(Re-rank):用更强的二分类模型对“问句—片段”配对打分,显著提升前列质量。
查询重写:多轮对话把“它/那条标准/这个设备”补全成明确实体,检索更稳。
强约束提示:要求“大模型仅基于引用回答;找不到就说找不到;必须标注[1][2]引用”。
5. 权限与合规(务必前置)
检索前置过滤:只能在有权限的文档集合里搜索,避免“先泄露再遮羞”。
溯源与留痕:返回引用编号/SQL/接口日志;审计记录“谁在何时查了什么”。
脱敏与水印:对敏感字段做可逆/不可逆脱敏,结果页打水印与过期策略。
6. 评测与迭代:看 5 件事
准确率:答案是否正确、符合口径;
覆盖率:在评测集能答出的比例;
引用命中率:答案是否引用了包含关键信息的片段;
幻觉率:凭空编造的比例;
性能/成本:P95 时延、QPS、召回/重排/生成各阶段耗时与花费。
落地建议:用真实问题做 100–300 条评测集,持续 A/B(如“只向量 vs 混合检索”、“有无重排”、“RAG vs 片段直返”)。
7. 能源/政企类典型问题如何路由(示例)
“两票制度第 5.3 条是什么?” → 片段直返/抽取式(给原文和出处)
“检修工作票与巡检流程差异?” → RAG(跨文档对比 + 引用)
“8 月焦炉煤气消耗率同比?” → Text-to-SQL(返回数值 + SQL 溯源)
“设备 ABC-123 的备件编码和供应商?” → API/ERP 查询(可辅以 RAG 解释)
8. 快速落地的 5 步(团队最小闭环)
聚焦一个域(如“设备台账”或“招采 FAQ”),整理成
.md/.txt
;索引与检索:混合检索(向量+B M25)+ 交叉重排;
统一返回层:答案 + 引用(或 SQL/API 记录);
权限前置 + 审计日志;
反馈回流:一键把“坏例子”沉淀进评测集与召回词库。
9. 常见误区(避坑清单)
只用向量、不做 BM25 → 编号/术语/公式命中差。
分块过大 → 命中稀释、时延变高;过小 → 语义断裂。
只做 RAG、不做 SQL/API → 数字问题答不准还贵。
权限后置 → 生成阶段再过滤已太晚。
不贴引用/SQL → 用户无法复核,信任感差。
10. 一句话总结
知识库问答是“多策略工具箱”,RAG 是其中一把强力扳手。
把“意图路由—检索/查询—可溯源返回—权限审计”这条主干走稳,比单点模型堆料更重要。