当前位置: 首页 > news >正文

RagFlow+Deepseek构建个人知识库

RagFlow+Deepseek构建个人知识库

  • RAGFlow的github地址

    https://github.com/infiniflow/ragflow

部署RAGFlow

  • windows可以在WSL中操作,尽量跟着官方的步骤来,避免一些奇奇怪怪的错误

  • 硬件先决条件

    1. CPU >= 4 cores
    2. RAM >= 16 GB
    3. Disk >= 50 GB
    4. Docker >= 24.0.0 & Docker Compose >= v2.26.1

    使用下面的命令查看docker和docker-compose的版本是否满足

    docker --version
    docker-compose --version
    

    image-20250313214217627

  • 确保vm.max_map_count >= 262144:

    检查vm.max_map_count的值:

    sysctl vm.max_map_count
    

    如果不是,则将vm.max_map_count重置为至少 262144 的值。

    sudo sysctl -w vm.max_map_count=262144
    

    此更改将在系统重启后重置。永久更改的话要添加或者更新**/etc/sysctl.conf**中的vm.max_map_count值如下:

    vm.max_map_count=262144
    
  • 克隆仓库

    git clone https://github.com/infiniflow/ragflow.git
    

    克隆完成后会出现一个 ragflow文件夹 image-20250313214600991

  • 使用docker-compose启动

    注意,ragflow 镜像有多个不同的大小,默认的是v0.17.2-slim,区别如下,主要是包不包含embedding模型的区别,我选的默认的,因为占用小,并且我后续使用调用api的方式去配置embedding模型,所以就选,默认的。

    RAGFLow机械标签镜像大小 (GB)是否有嵌入模型稳定版本?
    v0.17.2≈9✔️Stable release
    v0.17.2-slim≈2Stable release
    nightly≈9✔️Unstable nightly build
    nightly-slim≈2Unstable nightly build

    如果希望使用v0.17.2,可以修改docker-compose.yml文件中的版本为v0.17.2即可

    vim ragflow/docker/.env
    

    image-20250313220041569

    cd ragflow/docker
    docker compose -f docker-compose.yml up -d
    

    第一次会先拉取镜像,完成后如下

    image-20250313215007014

  • 服务启动并运行后检查服务的状态

    docker logs -f ragflow-server
    

    image-20250313220151981

  • 登录

    在本机浏览器中登录

    http://127.0.0.1:80

    image-20250313220334218

    请先点击 SignUp 注册

    image-20250313220515071

    登录后按如下步骤将语言更改为中文

    image-20250313220817150

    记得点击右下角保存


配置系统模型

  • 添加embedding模型

    如果在上一步使用docker-compose启动中已经选择了带有embedding模型的镜像,这一步可以省略

    image-20250313221145882

    这里直接调用硅基流动的api,下面的博客有注册的方法

    https://editor.csdn.net/md/?articleId=145558234

    然后在系统模型设置中将默认的嵌入模型选择为bgd-large-zh-v1.5

    image-20250313222605460

  • 添加聊天模型

    本地用ollama部署一个deepseekr1-1.5b的模型

    https://editor.csdn.net/md/?articleId=146216662

    查看模型填入的名称,如果是直接下载的软件包安装的,打开终端输入以下命令查看

    ollama list
    

    如果是docker部署的ollama先进入容器再查看,假设ollama容器名称就叫ollama

    docker exec -it ollama /bin/bash
    ollama_list
    

    image-20250313223025981

    这个NAME下面的就是需要输入的名称

    deepseek-r1:1.5b

    image-20250313223259995

    如果ollama和ragflow都是docker部署的,那么这里的基础url填

    http://host.docker.internal:11434

    否则填

    http://127.0.0.1:11434

    配置好系统聊天模型
    image-20250313223506651


创建知识库并使用

  • 先测试下聊天

    聊天–>新建助理–>确定

    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

    问一下 凡人修仙传中韩立的宗门是哪里,没有知识库的deepseek回答错误

    image-20250313224304785

  • 创建一个知识库,我们以凡人修仙传中韩立的相关资料为例子,先让怕kimi帮忙生成一个韩立的介绍

    image-20250313224602250

    我们吧介绍保存为韩立介绍.pdf

  • 创建知识库 凡人修仙传韩立

    image-20250313224825483

    下拉到最下面直接点击保存

    image-20250313225729913

    新增文件,将pdf上传并确定

    image-20250313225900717

    点击解析,等待解析成功

    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • 使用知识库

    新建助理,选择刚刚创建的知识库

    image-20250313230610447

    现在我们可以使用这个知识库里面的内容了

    image-20250313231000460

    我们可以看到已经引用到上传的pdf了,点击引用的标识,可以看到引用的内容出自哪里

    image-20250313231156094


相关文章:

  • 深入理解TCP/IP网络模型及Linux网络管理
  • modbusrtu.h:5:10: error: ‘QSerialPort‘ file not found
  • 技术视界|构建理想仿真平台,加速机器人智能化落地
  • 文件解析漏洞靶场通关合集
  • Java泛型(Generics(
  • Java定时任务1_定时任务实现方式以及原理
  • 基于JSP和SQL的CD销售管理系统(源码+lw+部署文档+讲解),源码可白嫖!
  • ubuntu ollama+dify实践
  • 基金交易系统的流程
  • 国产主流数据库存储类型简析
  • 接口自动化测试实战(超详细的)
  • 小程序主包方法迁移到分包-调用策略
  • Python区块链应用开发从入门到精通
  • Word 小黑第19套
  • redis 配置
  • mingw工具源码编译
  • SAP BC 记一次 DBCO 链接ORACLE DBCC 连接测试突然失败的问题
  • tomcat配置应用
  • 【区块链+ 医疗健康】基于区块链的医院诊所信息系统 | FISCO BCOS 应用案例
  • 整合记录-持续
  • 武汉企业网站推广公司/长春seo顾问
  • 麟游住房和城市建设局网站/数据网站有哪些
  • 做视频资源网站有哪些难点/提升seo排名平台
  • 做业精灵官方网站/设计外包网站
  • 360神搜网站建设/51link友链
  • wordpress 下划线/青岛推广优化