当前位置: 首页 > news >正文

安装NVIDIA驱动、配置docker运行时、docker部署GPUStack及ragflow集成GPUStack模型(WSL下ubuntu)

因为ollama不支持Reranker重排序模型,所以又开始另一顿瞎折腾,然后就找到GPUStack了。

1.安装NVIDIA驱动及配置docker运行时

# 验证当前环境是否有 NVIDIA GPU 硬件
lspci | grep -i nvidia

# 验证系统是否已安装GCC
gcc --version
# 安装GCC
#sudo apt-get update
#sudo apt-get install build-essential 
#gcc --version

# 安装 NVIDIA 驱动
# 1.为当前内核安装内核头文件和开发包:
sudo apt-get install linux-headers-$(uname -r)
# 2.安装cuda-keyring包(版本看自己的https://developer.download.nvidia.cn/compute/cuda/repos)
#  查询ubuntu版本
# lsb_release -a
# 这里是ubuntu2404/x86_64版本
wget https://developer.download.nvidia.cn/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
# 3.安装 NVIDIA 驱动
sudo apt-get update
sudo apt-get install nvidia-open -y
# 重启系统
sudo reboot
# 查看驱动信息
nvidia-smi

# 安装 NVIDIA Container Toolkit
# 1.配置 NVIDIA Container Toolkit 的生产仓库
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

# 2.安装 NVIDIA Container Toolkit
sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit -y

# 使用nvidia-ctk命令配置容器运行时
sudo nvidia-ctk runtime configure --runtime=docker
# 查看daemon.json文件信息
cat /etc/docker/daemon.json
# 重启docker
sudo systemctl restart docker

2.GPUStack部署

  • docker-compose.yaml
    docker-compose方便些,直接参考官网用docker run命令运行也行
    端口的话有需要就自己配置,默认80。因为我80已经给ragflow了,所以改用81。
    version: '3.8'
    
    services:
      gpustack:
        image: gpustack/gpustack
        container_name: gpustack
        restart: unless-stopped
        ports:
          - "81:80"
          # - "10150:10150"
          # - "40000-41024:40000-41024"
          # - "50000-51024:50000-51024"
        ipc: host #设置为host以共享宿主机的IPC命名空间
        volumes:
          - ./data:/var/lib/gpustack #挂载路径自己看着来
        deploy: # 定义部署时的资源限制。这里指定了使用所有可用的 NVIDIA GPU
          resources:
            reservations:
              devices:
                - driver: nvidia
                  count: all #指定gpu个数,all则为全部
                  capabilities: [gpu]
    
  • 运行GPUStack并获取初始化密码
    # 启动
    docker-compose up -d
    # 查看运行状态
    docker ps|grep gpustack
    # 打印日志
    docker logs -f gpustack
    # 正常运行的话,就获取一下初始化密码
    docker exec -it gpustack cat /var/lib/gpustack/initial_admin_password
    

3.访问GPUStack并部署模型

  • GPUStack是一个专为运行大语言模型(LLM)设计的开源GPU集群管理器。具体特点和功能直接官网查看,简单罗列下

    • 支持文本、图像、语音大模型
    • 支持LLM、Embedding、Reranker
    • 支持 HuggingFace、Ollama Library、ModelScope 和私有模型仓库部署模型
    • 支持 vLLM 和 llama-box 推理后端
  • 访问localhost:81

    • 登录并修改密码:admin账号、密码为上一步获取到的初始化密码。进去之后会提示修改密码。
  • 部署模型:选择自己想要的模型,点击保存即可自动下载并启动,可以在模型菜单处查看。(国内推荐用ModelScope)

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 配置gpustack的api密钥:记得把密钥复制出来保存后面要用到

    在这里插入图片描述

4.ragflow中添加gpustack模型

  • 获取访问url:直接在gpustack试验场菜单下选择自己需要添加的模型,点击右上角【代码查看】可以看到访问api的url
    在这里插入图片描述
    • 模型提供商处找到GPUStack进行添加
      在这里插入图片描述
      因为我已经配置过了,页面没找到可以查看信息的,直接数据库看数据吧
      在这里插入图片描述

在这里插入图片描述
好了,这样就集成进去了。

相关文章:

  • uniapp微信小程序基于wu-input二次封装TInput组件(支持点击下拉选择、支持整数、电话、小数、身份证、小数点位数控制功能)
  • iframe学习与应用场景指南
  • 【技术白皮书】外功心法 | 第四部分 | 数据结构与算法基础(常用的数据结构)
  • MySQL之事务理论和案例
  • SQLyog使用教程
  • ASP.NET中将 PasswordHasher 使用的 PBKDF2 算法替换为更现代的 Scrypt 或 Argon2 算法
  • 语音外呼提高CPS转化案例
  • 【教程】优化xrdp的性能
  • 数字内容体验构建品牌忠诚新路径
  • Open GL ES-> 工厂设计模式包装 SurfaceView + 自定义EGL的OpenGL ES 渲染框架
  • AI大模型学习七:‌小米8闲置,直接安装ubuntu,并安装VNC远程连接手机,使劲造
  • selenium元素获取
  • 【时时三省】Python 语言----正则表达式
  • 检测到目标URL存在http host头攻击漏洞
  • 北京市生成式人工智能大模型备案综合分析情况
  • 聚焦AI与大模型创新,紫光云如何引领云计算行业快速演进?
  • GoLand 标红但程序可正常运行:由符号索引缓存失效引起的假报错问题
  • 1 深入理解 DevOps 与 CI/CD:概念、流程及优势
  • 数据分析之python处理常用复杂转置数据
  • typescript开发心得
  • 如何查询网站开发语言/电商网站建设开发
  • 偃师做网站/免费换友情链接
  • 海拉尔做网站/seo人员的职责
  • 如何在凡科建设网站/品牌活动策划
  • 流行的网站开发技术/58同城如何发广告
  • 网站关键词优化外包/长沙网站seo报价