当前位置: 首页 > news >正文

docker利用docker-compose-gpu.yml启动RAGFLOW,文档解析出错【亲测已解决】

0.问题说明

想要让RAGFLOW利用GPU资源跑起来,可以选择docker-compose-gpu.yml启动。(但是官网启动案例是×86平台的不是NVIDIA GPU的,docker-compose-gpu.yml又是第三方维护,所以稍有问题)

1.问题

docker利用docker-compose-gpu.yml启动RAGFLOW,文档解析出错
报错:

18:10:23 [ERROR][Exception]: NCCL Error 2: unhandled system error (run with NCCL_DEBUG=INFO for details)

报错提示

2.解决方案

(1)修改docker-compose-gpu.yml文件(稍作改动)
修改样例

下面是修改后的完整docker-compose-gpu.yml文件,可以直接复制。

# The RAGFlow team do not actively maintain docker-compose-gpu.yml, so use them at your own risk.
# However, you are welcome to file a pull request to improve it.
include:
  - ./docker-compose-base.yml
 
services:
  ragflow:
    depends_on:
      mysql:
        condition: service_healthy
    image: ${RAGFLOW_IMAGE}
    container_name: ragflow-server
    ports:
      - ${SVR_HTTP_PORT}:9380
      - 80:80
      - 443:443
    volumes:
      - ./ragflow-logs:/ragflow/logs
      - ./nginx/ragflow.conf:/etc/nginx/conf.d/ragflow.conf
      - ./nginx/proxy.conf:/etc/nginx/proxy.conf
      - ./nginx/nginx.conf:/etc/nginx/nginx.conf
    env_file: .env
    ipc: host
    shm_size: 8g
    environment:
      - TZ=${TIMEZONE}
      - HF_ENDPOINT=${HF_ENDPOINT}
      - MACOS=${MACOS}
      - NCCL_DEBUG=INFO
    networks:
      - ragflow
    restart: on-failure
    # https://docs.docker.com/engine/daemon/prometheus/#create-a-prometheus-configuration
    # If you're using Docker Desktop, the --add-host flag is optional. This flag makes sure that the host's internal IP gets exposed to the Prometheus container.
    extra_hosts:
      - "host.docker.internal:host-gateway"
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]

参数解释:
ipc: host:允许容器共享主机的IPC命名空间,解决NCCL多卡通信问题
shm_size: 8g:增大共享内存容量(默认64MB不足)

(2)通过docker-compose-gpu.yml重新启动RAGFLOW

docker compose -f docker-compose-gpu.yml up -d

(3)运行ragflow-server服务器

docker logs -f ragflow-server

(4)检查是否成功进行文档解析

成功解析如下结果:
成功解析
到此,问题解决!

相关文章:

  • 大模型训练微调技术介绍
  • 软考中级数据库思维导图
  • 【音视频】RGB、YUV基础
  • GCC RISCV 后端 -- GCC 后端框架的一些理解
  • Html5学习教程,从入门到精通,HTML 5 图像语法知识点语法知识点及案例代码(9)
  • AWS VPC行业解决方案:构建安全、灵活的企业云网络
  • Spring项目中常用操作记录
  • 因子分析讲解
  • C++类与对象:银行管理系统项目实战开发LeetCode每日一题
  • 【Web前端开发】---HTML标签及标签属性
  • 云计算中的“按需扩展”和“自动扩展”有何不同?
  • Ubuntu20.04双系统安装及软件安装(七):Anaconda3
  • pnpm+monorepo实现前端公共函数、组件库
  • 千兆网络测试仪使用全解析:从线序检测到性能压测实战
  • MySql基础以及安装
  • Ubuntu20.04双系统安装及软件安装(十一):向日葵远程软件
  • 如何在 C# 中检查两个对象是否完全相同?
  • 山东大学计算机科学与技术学院软件工程实验日志
  • python及pycharm安装配置
  • Pytorch构建LeNet进行MNIST识别 #自用
  • 怎么做网站的防盗链/google谷歌搜索引擎
  • 运河网站制作/杭州seo联盟
  • 叫别人做网站安全吗/广州百度推广开户
  • 网站后台培训/头条号权重查询
  • 网站服务器和vps做一台/营销qq
  • 柳州专业网站推广公司/免费建站网站大全