当前位置：首页 > news >正文

【面试题】关于RAG的五道题

news 2025/9/10 4:03:25

✅ 问题：什么是 RAG？
✅ 问题：说一下 RAG 核心技术？
- 1. **检索器（Retriever）**
- 2. **生成器（Generator）**
- 3. **整合策略（Integration）**
- 4. **关键优化技术（2024~2025 主流）**
✅ 问题：为什么需要 RAG-Fusion？
- ❗ 传统 RAG 的缺陷：
- ✅ RAG-Fusion 工作流程：
- ✅ 优势：
- ⚠️ 不足：
✅ 问题：RAG VS SFT
✅ 问题：RAG 未来发展方向
- - - 1. **Agentic RAG（智能体化）**
    - 2. **Self-RAG & RA-DPO（自我优化）**
    - 3. **多模态 RAG**
    - 4. **实时 & 流式 RAG**
    - 5. **小型化 & 边缘部署**
    - 6. **评估标准化**
    - 7. **神经符号融合**

✅ 问题：什么是 RAG？

最准确答案：

RAG（Retrieval-Augmented Generation，检索增强生成） 是一种将“外部知识检索”与“大语言模型生成”相结合的框架，旨在提升 LLM 在开放域问答、知识密集型任务中的准确性、可追溯性和知识更新能力。

其标准流程为：

🔬 本质公式：
P(answer | query) ≈ Σ P(answer | query, doc_i) · P(doc_i | query)
即：答案的概率分布由检索到的证据文档加权决定。

💡 核心价值：
让 LLM 从“闭卷考试”（依赖参数记忆）变为“开卷考试”（依赖外部证据），显著减少幻觉、支持知识动态更新、提高可解释性。

📌 典型架构：
Query → Embedding Model → Vector DB → Top-K Docs → Prompt Template → LLM → Answer

✅ 加分项：

引用 Facebook 2020 年原始论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》
对比“参数化知识” vs “非参数化知识”

最准确答案：

RAG 的核心技术可归纳为“三模块 + 两优化”：

稠密检索（Dense Retrieval）：
使用 Sentence-BERT、BGE、E5 等模型将 Query 和文档映射到同一向量空间，通过余弦相似度召回。
→ 优点：语义匹配强；缺点：计算成本高，OOV 敏感。
稀疏检索（Sparse Retrieval）：
BM25、SPLADE —— 基于词频/倒排索引，擅长关键词匹配。
→ 优点：速度快，可解释；缺点：语义泛化弱。
混合检索（Hybrid）：
ColBERT（延迟交互）、DPR + BM25 融合 → 兼顾语义与词匹配。

LLM 选择：GPT-4、Claude 3、Llama 3、Command R+、Qwen-Max 等，需支持长上下文（≥32K）。
Prompt 工程：
- 明确指令：“仅基于以下文档回答…”
- 引用要求：“请标注答案来源（如[1]）”
- 格式约束：JSON / XML / Markdown 输出

✅ 加分项：

提及“检索是瓶颈，不是银弹”（Lost in the Middle 论文）
画架构图：User → Query → Retriever → Reranker → Generator → Output

最准确答案：

RAG-Fusion 是为解决“单一查询语义局限性”而设计的高级检索策略，其核心思想是：

“一个查询的多种表达，比一个表达更接近真相。”

Query Generation：
原始 Query → 由 LLM 生成 N 个语义等价或互补的变体
（如：“苹果市值？” → “Apple market cap 2024?”、“苹果公司最新估值？”）
Parallel Retrieval：
每个 Query 独立检索 Top-K 文档 → 得到 N × K 个候选
Reciprocal Rank Fusion（RRF）：
$Score(d)=∑q∈queries1rankq(d)+60\text{Score}(d) = \sum_{q \in \text{queries}} \frac{1}{\text{rank}_q(d) + 60}$
- rank_q(d)：文档 d 在查询 q 的结果中的排名（从1开始）
- +60：平滑因子，避免低排名文档得0分
- 总分越高，文档综合相关性越强
重排序后取 Top-K 送入 LLM 生成

✅ 加分项：

手写 RRF 公式并解释 +60 的作用
对比：RAG-Fusion vs HyDE vs Query2Doc
引用 LangChain / LlamaIndex 中的实现

最准确答案：