当前位置：首页 > news >正文

【RAG 系统实战课】01 用RAG改造传统MIS系统

news 2025/10/31 6:34:57

文章目录

- 一、项目示例
- 二、基础知识：对话模式
- - 2.1 概念
  - 2.2 RAG
- 三、基础知识：返回结构化数据
- 四、项目实现
- - 4.1 申请大模型
  - 4.2 调用大模型
- 五、其他

一、项目示例

代码地址：https://github.com/weiminye/time-geekbang-org-rag

项目使用了 Python3.9

（1）安装依赖

进入源代码解压后的目录，然后再进入

cd 源代码解压后的目录
cd 实战案例1\改造前

输入以下命令安装所有依赖

pip install -r requirements.txt

（2）运行示例

python manage.py migrate
python manage.py runserver

打开浏览器，访问 http://127.0.0.1:8000/，出现如下页面。
在这里插入图片描述

二、基础知识：对话模式

2.1 概念

在对话里，用户一般称为 user， AI 一般称为 assistant。比较特殊的是，从 ChatGPT（GPT3.5）开始，OpenAI 新增了一个角色——system（系统的英文），这个角色有助于设置 AI 的行为。你可以在 system 角色里面，描述 AI 在整个对话过程中应该如何表现。例如：

系统：你是一个ERP MIS系统
用户：客户A的款项到账了多少？
AI：已到账款项为57980。

但有两点需要我们注意。第一，系统消息是可选的。第二，目前除了 OpenAI 之外，很多大模型都不支持系统这一角色。

2.2 RAG

RAG 全称是“Retrieval-Augmented Generation”，即“检索增强的生成”。

它的核心思想是利用外部知识库或数据集来辅助模型的生成过程。具体来说，RAG 通常包含以下关键步骤。

检索阶段：首先，模型会根据输入的查询或问题，从预先构建的索引中检索出最相关的数据、文档或文本片段。
生成阶段：随后，模型会使用这个综合的表示来生成答案或输出文本。在问答任务中，这通常意味着生成一个对原始查询的直接回答。

除此之外，还有两个阶段：

编码阶段：检索到的文档或文本片段会与原始查询一起被编码成高维向量（多维数组的专业说法，只不过这里的多维多到几百、上千的那种）。
融合阶段：编码后的向量会进行融合，以生成一个综合的表示，这个表示同时包含了原始查询和检索到的相关信息。

也就是说RAG会包含四个阶段：

检索阶段
编码阶段
融合阶段
生成阶段

但编码和融合阶段并不是 RAG 应用必需的，检索和生成阶段才是 RAG 应用必需的。

在这里插入图片描述

三、基础知识：返回结构化数据

大模型对话模式返回的结果通常是人类语言，我们可以通过一些特定的 prompt 让模型返回 JSON 格式的结果。

无论要返回什么类型的数据，可以都让模型以 JSON 格式的方式返回。

此外还可以添加辅助信息。通过辅助信息我们可以理解大模型为什么会输出这样的结果。例如，我们可以要求大模型输出以下 json 结果。

{'result':false,'理由':'不是，老婆饼和老婆不是同一类东西'}

Few-shot

在实际应用中，大模型可能还是无法正常输出结构化数据。这时可以给大模型一个示例，让大模型参考输出。提供示例的对话模式如下。

messages=[
  {"role": "user", "content": f"""
  请根据用户的输入返回json格式结果：
  
  示例1：
  用户：客户北京极客邦有限公司的款项到账了多少？
  系统：
  {{'模块':1,'客户名称':'北京极客邦有限公司'}}

  用户：{用户输入}
  系统：
  """},
  ]

四、项目实现

原文 UI 部分、DB部分等与RAG无关，这里不展开，具体可参考项目代码。

4.1 申请大模型

这里使用使用百度 ERNIE-Lite-8K 大模型。

由于百度的 v1 版本推理服务创建入口关闭，原文的鉴权方式已经失效，详见：v1版本推理服务创建入口关闭通知

新的 v2 版本的 API 鉴权方式参考：https://cloud.baidu.com/doc/WENXINWORKSHOP/s/Um2wxbaps

4.2 调用大模型

v2 版本模型服务的调用方式与原文有一些区别，具体可参考官网文档：https://cloud.baidu.com/doc/WENXINWORKSHOP/s/Fm2vrveyu

五、其他

python 代码归类技巧，可以将代码用 region 块分隔，示例如下：

# region 跟具体大模型相关的，如果需要修改大模型，可能需要修改这部分函数
....
# endregion

#region 诊断与调试
...
#endregion

分块后可以按 region 折叠。

查看全文

http://www.dtcms.com/a/105065.html

MySQL 中常用的日期和时间类型

Nuxt2中全局路由守卫的写法（含Nuxt3写法和变化）

01背包问题二维数组和一维数组间的区别

RAG优化：python从零实现Proposition Chunking[命题分块]让 RAG不再“断章取义”，从此“言之有物”！

基于mediapipe深度学习和限定半径最近邻分类树算法的人体摔倒检测系统python源码

步进电机驱动电压对定位精度的深层影响分析

机器学习的定义及分类

# 注意力机制

Spring Event 观察者模型及事件和消息队列之间的区别笔记

HMTL+JS+CSS实现贪吃蛇游戏，包含有一般模式，困难模式，还有无敌模式

前端如何导入谷歌字体库

arm_mat_init_f32用法 dsp库

ansible-playbook 执行剧本报错： libselinux-python) aren‘t installed!

智慧管理 | 共享茶室：可远程实时查看的物联网框架要怎么选？

Mysql-数据库、安装、登录

使用string和string_view(四)——练习

位置编码汇总 # 持续更新

AI提示词：自然景区智能客服

计算机网络知识点汇总与复习——（二）物理层

# 深度学习基础算法：NN、RNN、CNN

机器学习-04-分类算法-04-支持向量机SVM-案例

保姆级教程：synchronized 同步方法 vs 同步代码块，看完彻底懂锁！

QML-项目实战二

Ubuntu Live USB 如何使用

《深度洞察：MySQL与Oracle中游标的性能分野》

重新排序--区间问题--差分求频率，全开ll

静态路由复习实验

MyBatis-Plus逆向工程

ORM框架

SQL Server安装后 SSMS 无法连接：身份验证模式错误