当前位置：首页 > news >正文

增强检索知识库系统1

news 2025/7/11 15:50:55

项目概述

这是一套基于 Ollama DeepSeek、OpenAI 大模型构建的增强 RAG&MCP 知识库检索项目。

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息，并将其作为提示（Prompt）输入给大型语言模型（LLMs），以增强模型处理知识密集型任务的能力，如问答、文本摘要、内容生成等。

可以参考这两个博客来了解 RAG：

https://zhuanlan.zhihu.com/p/668082024
一文彻底搞懂大模型 - RAG（检索、增强、生成）-CSDN博客

本项目除了普通的文本解析以外，还增加了 Git 代码块拉取和解析，并提供操作接口。同时也增效了需求分析、研发设计、辅助编码、代码评审、风险评估、上线检测等工程环节。

MCP（Model Context Protocol，模型上下文协议）定义了应用程序和 AI 模型之间交换上下文信息的方式。这使得开发者能够以一致的方式将各种数据源、工具和功能连接到 AI 模型（一个中间协议层），就像 USB-C 让不同设备能够通过相同的接口连接一样。MCP 的目标是创建一个通用标准，使 AI 应用程序的开发和集成变得更加简单和统一。

可以参考这两个博客来了解 MCP：

https://zhuanlan.zhihu.com/p/29001189476
深入浅出理解MCP：从技术原理到实战落地_mcp原理-CSDN博客

MCP 官方文档：MCP 简介 - MCP 中文文档
MCP 中文社区：最大的 MCP 中文社区
MCP 服务网站：海量 MCP Servers 导航网站，GitMCP，MCP Servers

一条命令帮研发，调用应用系统日志、排查系统 CPU 负载、自主选择是否调度数据库信息。
一条命令帮运营，搞定复杂的 SQL 执行、导出报表、分析数据、完成促活营销券的自动化配置上架。

!RAG+MCP=Ai Agent 智能 AI 工作

AI Agent 通常翻译做：人工智能代理，或者人工智能智能体。简单来说：如果说大语言模型（LLM）是强大的 “大脑”，那么 AI Agent 就是配备了 “四肢” 和 “感官”，是一个能够感知环境、自主规划、执行任务并持续学习的智能实体。

可以参考这两个博客来了解 AI Agent：

https://zhuanlan.zhihu.com/p/1918744512756454322
AI Agent：7个国内框架 & Agent应用_ai agent框架-CSDN博客

Agent 文档库：检索增强生成 (RAG) | Prompt Engineering Guide

第一节：AI RAG 知识库项目介绍

大家平常使用 AI 的时候肯定也碰到过 ' 文字过多，不可以发送 ' 的情况。但是我们在编写一个程序的时候，一小个 demo 都有几百行代码，如果这时候我们还想用 AI 来帮我们检查错误的话是不是难以实现？基于此我们就要学习 RAG，来帮我们更好的和 AI 进行对话。

RAG 检索增强生成技术，它将检索和生成相互结合，可以让 AI 从海量信息中快速提取到关键词，并结合上下文，给出更加精准、连贯的答案。企业也可以构建自己的 RAG 知识库，给用户提供更加个性化专业化的服务。

大家可以参考以下文档来更加深入的了解 RAG：检索增强生成 (RAG) | Prompt Engineering Guide

在我们平时开发的时候，都知道给 AI 的提示词越多就可以得到更加准确的信息，基于这个原因，提示词工程还在 AI 早期爆火过一段时间。但是我们在使用 AI 的时候是不是会遇到这样的问题：
例：想要把 SQL 语句转化为 Java 对象，那我们在发送 SQL 语句的时候都要加一句：请你给我把这段 SQL 语句转变为 Java 对象，并且使用 Lombok 形式。
这样是不是过于繁琐了？基于此我们可以建立一个知识库，让文本匹配知识库，我们每次使用 SQL 语句转化为 JAVA 语句的时候，就使用这个知识库，减少了复制粘贴的场景，减少不必要的工作。