大语言模型 LLM 通过 Excel 知识库 增强日志分析,根因分析能力的技术方案(1):总体介绍
文章大纲
-
- 1. 核心目标
- 2. 系统总体架构
- 3. Google Cloud 端到端方案(含无 RAG & RAG 双模式)
-
- 3.1 无 RAG:Function-Calling 查表模式
- 3.2 RAG:托管式向量检索
- 4. 开源轻量级方案
- 5. 数字孪生联合验证(实验性)
- 6. 知识图谱增强(Neo4j)
- 7. 监控与持续优化(CometLLM)
- 8. 实施路线图(4~10 周)
- 9. 典型案例速览
- 10. 一键复现仓库
- 11. 参考文献
1. 核心目标
让 LLM 在“零重写、低延迟、高准确率”条件下,利用 Excel 表格中的设备参数、故障码、维修记录等结构化知识,完成实时日志解析与根因定位。
2. 系统总体架构
层级 | 技术选型(Google Cloud) | 技术选型(开源/本地) |
---|---|---|
日志采集 | Pub/Sub + Dataflow | Kafka + Flume |
知识库 | Cloud Storage Excel → Document AI → Vertex AI Vector Search | Excel → pandas → FAISS/Chroma |
LLM 引擎 | Vertex AI PaLM 2 / Gemini 1.5 Pro | Llama-3-8B + vLLM |
数字孪生 | Unity 云渲染 + Cloud Run API | Unreal Engine + REST |
知识图谱 | Neo4j Aura + Ve |