当前位置: 首页 > news >正文

Centos7系统基于docker下载ollama部署Deepseek-r1(GPU版不踩坑)

 

目录

一、Docker下载安装

 二、Ollama安装

三、部署Deepseek-R1


一、Docker下载安装

1、更新源

sudo yum update -y

2、下载依赖包

yum install -y yum-utils device-mapper-persistent-data lvm2

3、添加docker远程仓库地址

yum-config-manager --add-repo http://download.docker.com/linux/centos/docker-ce.repo(中央仓库)

yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo(阿里仓库)

4、下载安装docker

sudo yum install docker-ce

5、启动docker,并设置开机自启动

sudo systemctl start docker
sudo systemctl enable docker

下面的docker的一些其他设置,不需要的可忽略:

1、GPU版NVIDIA Container Toolkit(CPU忽略)

#添加仓库
sudo yum-config-manager --add-repo https://nvidia.github.io/nvidia-docker/centos7/nvidia-docker.repo
#下载
sudo yum install -y nvidia-docker2

会自动下载一些容器

同时会自动创建一个docker的配置文件/etc/docker/daemon.json,其内容为:

{
  "runtimes": {
    "nvidia": {
      "path": "nvidia-container-runtime",
      "runtimeArgs": []
    }
  }
}

2、修改docker安装目录(非必要)

因为根目录满了,所以挂载到其他目录下。

# 创建目标目录
mkdir /mnt/llm/soft/docker
# 停止docker服务
sudo systemctl stop docker
# 复制安装目录内容
sudo cp -r /var/lib/docker/* /mnt/llm/soft/docker 
# 修改配置文件
vi /etc/docker/daemon.json
# 添加自定义安装路径
"data-root": "/mnt/llm/soft/docker"

 二、Ollama安装

1、先为docker添加国内源,这样下载速度更快

"registry-mirrors": [
"https://docker.m.daocloud.io",
"https://docker.imgdb.de"
]

2、下载镜像

docker pull ollama/ollama

3、运行ollama

# GPU版
docker run -d --gpus=all -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
# CPU版
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

 

4、进入容器验证

docker exec -it 3e0510ca4aa9 /bin/bash

 

三、部署Deepseek-R1

1、查看运行容器id

docker ps

 2、进入容器内部验证ollama和GPU

# ollama安装验证,查看模型
ollama list
# GPU设置验证
nvidia-smi

 3、下载并安装Deepseek-r1

这里利用ollama工具可以下载它兼容的大模型,查看ollama官方模型链接https://ollama.com/search

 

# 运行deepseek-r1,第一次运行是会自动下载的,默认是7b
ollama run deepseek-r1
# 后缀指定模型大小
ollama run deepseek-r1:70b

至此成功完成部署!

http://www.dtcms.com/a/67340.html

相关文章:

  • 【C++ STL】 容器详解:queue 学习
  • 从头开始开发基于虹软SDK的人脸识别考勤系统(python+RTSP开源)(五)完整源码已上传!
  • 基于MySQL有用户管理的音乐播放器
  • Java 虚拟机优化指南:CMS垃圾回收器参数调优与性能监控工具详解
  • obeaver 连接oracle 库 模式乱码
  • XXE-labs靶场通关攻略
  • 【菜鸟飞】通过vsCode用python访问公网deepseek-r1等模型(Tocken模式)
  • cs224w课程学习笔记-第7课
  • Harmony OS:用户文件操作——图片选择与渲染使用
  • Docker根目录迁移与滚动日志设置
  • leetcode日记(96)有序链表转换二叉搜索树
  • 记录致远OA服务器硬盘升级过程
  • Android第二次面试总结(项目拷打理论篇)
  • Gone v2 中 Gone-Gin 性能测试报告
  • kotlin与MVVM的结合使用总结(二)
  • hackme靶机通关攻略
  • Java数组详解(一)
  • IDE 使用技巧与插件推荐:全面提升开发效率
  • vue3+ts+vite环境中使用json-editor-vue3,记录遇到的奇奇怪怪问题!!!
  • 三格电子Modbus TCP转CANOpen网关相关问答
  • 【vscode-01】vscode不同项目不同语言扩展插件隔离方案
  • 智算新纪元,腾讯云HAI-CPU助力法律援助
  • 提升工地安全:视觉分析助力挖掘机作业监控
  • 夜莺监控 v8.0 新版通知规则 | 对接企微告警
  • 前端面试:如何实现预览 PDF 文件?
  • PostgreSQL 日常SQL语句查询记录--空间查询
  • 单体架构、微服务组件与解决方案
  • 开VR大空间体验馆,如何最低成本获取最大收入?
  • RabbitMQ 实现原理及流程
  • 多线程--参数传递之间的关系