当前位置: 首页 > news >正文

linux端 RAGflow超详细小白教程(一)安装及环境搭建

针对现在ragflow部署指令太混乱的问题,没办法我只能自己写个总结了在这里插入图片描述

RAGflow地址:https://github.com/infiniflow/ragflow

一、系统要求

本项目优先部署在linux端
硬件:CPU ≥ 4核,内存 ≥ 16GB,磁盘 ≥ 50GB(推荐SSD)
软件:
Windows:WSL2 + Docker Desktop(需启用WSL集成)
Linux:Docker ≥ 24.0.0,Docker Compose ≥ v2.26.1
先查看docker版本和Docker Compose版本,如果系统等级不够先更新系统
记得写入参数vm.max_map_count=262144,主要是为了防止内存映射不足

#查看版本
docker --version
docker compose version
#如果版本足够不用更新,若没有则下载(可选)
sudo apt update && sudo apt upgrade -y
sudo apt install docker.io docker-compose python3-pip git -y
#防止内存映射不足
sudo sysctl -w vm.max_map_count=262144

二、项目下载

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker

配置镜像和检索加速。在docker/.env 文件修改

修改配置源下载完整版,第一个框注释掉,第二个框选择云,第一个云是华为云,第二个是阿里云,这里我选择华为云(如果只想下简单版可以不用修改,可选)
在这里插入图片描述 检索修改Especially为infinity(官方说 Linux在arm64架构下不支持但linux_x86可以使用.)
在这里插入图片描述

三、项目安装

创建容器
这里不同文章有很多种创建容器的方法
我总结一下
国内镜像加速命令(不推荐,容易出现es链接错误)
docker compose -f docker-compose-CN.yml up -d
依赖于base和gpu下载(如果电脑没有好的gpu不推荐)
docker compose -f docker-compose-base.yml -f docker-compose-gpu.yml up -d
老版直接下载(推荐,等同于docker compose -f docker-compose.yml up -d)
docker-compose -p ragflow up -d

总结后我的命令如下

#20250724版
sudo docker compose -f docker-compose.yml up -d

四、端口映射下载问题

下载过程中很容易遇见端口映射重复的问题,主要是在一个公司中,一台服务器会很多人都用,所以我们只能修改端口号防止冲突。
这里我正常的端口没有冲突
但是infinity冲突了5432端口,错误如下Error response from daemon: failed to set up container networking: driver failed programming external connectivity on endpoint ragflow-infinity : Bind for 0.0.0.0:5432 failed: port is already allocated
找到docker/.env 文件中配置的端口修改为5433保存
在这里插入图片描述

如果其他端口冲突则进入docker/你在步骤3中的.yml文件中,如果80端口被占修改,443端口被占也修改,一般是修改左边的数字映射
在这里插入图片描述

五、服务启动与关闭

查看服务是否成功启动

sudo docker logs -f ragflow-server

两个图标都出现一般就没有什么问题了
在这里插入图片描述

在这里插入图片描述

六、配置模型

我这里全是vllm部署的本地模型所以我直接连接,创建一个知识库为123先试试
在这里插入图片描述
在模型供应商那里选择你的模型
在这里插入图片描述
添加一个embedding模型,自己部署的不用写api
在这里插入图片描述
添加一个聊天模型
在这里插入图片描述
接着设置默认模型就好
在这里插入图片描述
然后在知识库里随便上传一个文件,这里我上传了一本书
在这里插入图片描述
点击解析
在这里插入图片描述
然后到检索这里测试一下有返回就行
在这里插入图片描述

http://www.dtcms.com/a/296116.html

相关文章:

  • Linux系统编程——网络
  • 河南萌新联赛2025第(二)场:河南农业大学(整除分块,二进制,树的搜索)
  • C++ explicit 上下文相关转换
  • 牛客多校04L :Ladder Challenge
  • 基于MASAC算法的建筑群需求响应系统设计与实现
  • 个人电脑 LLMOps 落地方案
  • pytest官方Tutorial所有示例详解(二)
  • 【AI】Java生态对接大语言模型:主流框架深度解析
  • FastAPI中间件
  • 如何在 conda 中删除环境
  • 常见半导体的介电常数
  • 告别下载中断:深入解析Tomcat JSP中的“远程主机强迫关闭连接”与“软件中止连接”
  • 理解传统部署下 Tomcat 核心组件与请求链路全流程
  • 详解力扣高频 SQL 50 题之584. 寻找用户推荐人【入门】
  • SpringBoot + Thymeleaf 实现模拟登录功能详解
  • SQL173 店铺901国庆期间的7日动销率和滞销率
  • 比例谐振控制器(PR控制器)在交流系统中的应用原理详细解析
  • Ubuntu安装jdk、上传jar包、运行java、配置域名、nginx接口映射、配置https域名
  • 一文读懂 HTTPS:证书体系与加密流程
  • HttpServletRequestWrapper存储Request
  • ORACLE DATABASE 23AI+Apex+ORDS -纯享版
  • 内网IM:BeeWorks私有化部署的安全通讯解决方案
  • 7.24路由协议总结
  • 使用Python采集招聘网站数据并智能分析求职信息
  • 11款Scrum看板软件评测:功能、价格、优缺点
  • 【News】同为科技亮相首届气象经济博览会
  • Ollama(5)服务接口压力测试
  • 【docker | 部署 】Jetson Orin与AMD平台容器化部署概述
  • 《 Spring Boot启动流程图解:自动配置的真相》
  • 美林数据用大模型重构电能质量评估,让隐蔽合规问题无所遁形