从零到一:RAGFlow 本地部署全攻略
RAGFlow 是一款开源 RAG(Retrieval-Augmented Generation,检索增强生成)引擎,核心卖点是“看得懂文档”。它把原本复杂的检索-生成链路打包成一条极简流水线,企业和个人都能即插即用。项目在 GitHub 上已斩获 4.8 万颗星,且还在加速吸粉——这份热度本身就是生成式 AI 应用圈子里“当红炸子鸡”的最佳注脚。
今天的分享,将带你一步步完成这款工具的本地部署。
第一步:获取项目源码
进入项目主页,点击右上角的 "Fork",将其复制到你的个人 GitHub 账号下。随后,在你 Fork 后的仓库页面,点击 "Code" 按钮,选择 "Download ZIP",将项目代码下载到本地。下载完成后,解压压缩包,并将其放置在你预先规划好的本地工作目录中。
先切到刚才解压出的目录,再进入里头的 docker 子目录,随后在该路径下启动 PowerShell。
首先,需要修改项目根目录下的 .env
配置文件。默认情况下,RAGFlow 安装的是轻量级模型,不包含嵌入(embedding)功能。通过调整 .env
文件中的相关参数,可启用并集成完整的嵌入模型,确保系统具备向量化处理能力。
下图是原始的.env 配置文件中嵌入模型状态
修改时,只需要在第一个框轻量级前加上 #,把第二个框的模型前去掉 #即可,可见对比图
在正式启动 Docker Compose 之前,得先改一下端口映射:机器里已经跑了 Dify,它把 80 和 443 占得死死的。为了避免冲突,把 RAGFlow 的端口改成 8080→80、8443→443 即可。
现在就可以输入命令,有两组命令可根据电脑进行选择
经过上面的步骤,现在 RAGFlow 就可以用 127.0.0.1:8080 打开了
登录RAGFlow后,先配置模型,填入相应的 API,系统会自动探测模型
其中,嵌入模型可选用 RAGFlow 内置的、专为中文优化的 BGE 模型(BAAI General Embedding)。该模型在中文语义理解方面表现优异,正是我们在前一步通过修改 .env
配置文件所启用的核心组件。
接下来就可以创建知识库,搭建属于自己的 Agent 了。搭建的一个属于你自己知识库及 Agent。
RAGFlow里的知识库不仅可以个人使用,也可以提供给团队使用,也是局域网使用知识库的解决方案之一。