Milvus + Reranker 混合搜索技术方案详细文档
Milvus + Reranker 混合搜索技术方案详细文档
1. 方案概述
本方案基于 Milvus 向量数据库实现混合搜索(Hybrid Search),结合稀疏检索(BM25)和稠密检索(向量相似度),并通过 Reranker 模型进行二次排序,以提升 RAG 系统的检索质量和答案准确性。
1.1 架构设计
查询输入↓
并行检索:
├── BM25 检索 (Elasticsearch/外部)
└── 向量检索 (Milvus)↓
RRF 融合算法↓
Reranker 重排序↓
最终结果 → LLM 上下文
1.2 技术栈选择
- 向量数据库: Milvus 2.3+
- 稀疏检索: Elasticsearch 8.x (提供 BM25)
- 嵌入模型: BAAI/bge-m3 或 bge-large-zh-v1.5
- 重排序模型: BAAI/bge-reranker-large
- 融合算法: RRF (Reciprocal Rank Fusion)