当前位置: 首页 > news >正文

从零实现本地大模型RAG部署

1. RAG概念

RAG(Retrieval-Augmented Generation)即检索增强生成,是一种结合信息检索与大型语言模型(大模型)的技术。从外部知识库(如文档、数据库或网页)中实时检索相关信息,并将其作为输入提供给 大模型,从而增强模型生成答案的能力,具体是指在大模型生成回答之前,先从知识库中查找相关的知识内容,增强信息生成过程中的知识库中的内容,从而提升生成的质量和准确性,这一过程分为三个阶段:

检索:使用向量数据库和近似最近邻(ANN)算法快速定位与查询相关的文本片段。
融合:将检索到的信息处理后与原始查询结合,形成扩展的上下文。
生成:大模型 基于融合后的上下文生成最终答案,减少“幻觉”现象。

2. RAGFlow 部署

RAGFlow是一个基于深度文档理解的开源RAG引擎。它为任何规模的企业提供了一个简化的RAG工作流程,结合LLM(大型语言模型)提供真实的问答功能,并得到各种复杂格式数据的充分引用。

2.1 源码加载

# 网盘地址: https://pan.baidu.com/s/1m0nUnq5po4zpnIWPvU_obw?pwd=zhen
git clone git@github.com:infiniflow/ragflow.git

在这里插入图片描述

2.2 修改配置版本

$ cd ragflow/docker
# 修改配置文件安装v0.17.2,默认是v0.17.2-slim
nano .env
RAGFlow 镜像标签镜像大小 (GB)具备嵌入模型是否稳定版
v0.17.2≈9✔️
v0.17.2-slim≈2
nightly≈9✔️
nightly-slim≈2

在这里插入图片描述

2.3 docker执行安装

cd 
# 仅使用CPU 执行任务:
# docker compose -f docker-compose.yml up -d
# 使用 GPU 加速:
docker compose -f docker-compose-gpu.yml up -d

在这里插入图片描述

3. 运行效果

相关文章:

  • PostgreSQL 16深度解析(从16.0-16.8)
  • 正则表达式 - 简介
  • 【算法】堆排序
  • jeecg拦截器 排除地址不让他拦截
  • 使用傅里叶级数和Python表示方波
  • 深度解析新能源汽车研发测试中的关键信号采集技术
  • Qt实现鼠标拖动窗口
  • Java 基础-32-枚举-枚举的应用场景
  • Flink介绍——实时计算核心论文之Storm论文详解
  • 以太网安全
  • 达芬奇20正式版 Davinci Resolve Studio 20 支持WIN
  • 【HarmonyOS Next之旅】DevEco Studio使用指南(十一)
  • Systemd构建容器化微服务集群管理系统
  • Ubuntu 22 Linux上部署DeepSeek R1保姆式操作详解(Xinference方式)
  • C++之红黑树
  • JAVA EE_多线程-初阶(二)
  • 车载诊断架构 --- 整车重启先后顺序带来的思考
  • 深入理解C++中的itoa()函数 --任意进制之间转换函数
  • 【并发编程 | 第七篇】深入学习线程池(一)
  • 程序化广告行业(64/89):AdX/SSP系统广告位设置全解析
  • 公司网站友情链接/搜索引擎有哪几个网站
  • 清远网站设计公司/注册网站免费注册
  • 建站网址打不开/游戏优化软件
  • 做情侣网站/网站如何建立
  • 政府网站建设排名/潍坊百度关键词优化
  • 手机图片网站 模版/seo软件代理