当前位置: 首页 > news >正文

Ollama Docker 镜像部署

文章来源:Docker 部署文档 -- Ollama 中文文档|Ollama官方文档

仅 CPU

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

英伟达 GPU

安装 NVIDIA Container Toolkit。

使用 Apt 安装
  1. 配置存储库

    curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey \
        | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
    curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list \
        | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' \
        | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
    sudo apt-get update
    
  2. 安装 NVIDIA Container Toolkit 软件包

    sudo apt-get install -y nvidia-container-toolkit
    
使用 Yum 或 Dnf 安装
  1. 配置存储库

    curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo \
        | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
    
  2. 安装 NVIDIA Container Toolkit 软件包

     sudo yum install -y nvidia-container-toolkit
    
配置 Docker 以使用 Nvidia 驱动程序
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
启动容器
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

[!NOTE]
如果您在 NVIDIA JetPack 系统上运行,Ollama 无法自动发现正确的 JetPack 版本。将环境变量 JETSON_JETPACK=5 或 JETSON_JETPACK=6 传递给容器以选择版本 5 或 6。

AMD 图形处理器

要使用带有 AMD GPU 的 Docker 运行 Ollama,请使用rocm标签和以下命令:

docker run -d --device /dev/kfd --device /dev/dri -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm

在本地运行模型

现在您可以运行模型:

docker exec -it ollama ollama run llama3.2

尝试不同的模型

更多模型可以在 Ollama 库中找到。

文章来源:Docker 部署文档 -- Ollama 中文文档|Ollama官方文档

http://www.dtcms.com/a/30429.html

相关文章:

  • IEEE官方期刊缩写查询pdf分享
  • Spring MVC的基本概念
  • 【编程语言】委托与函数指针
  • Java 中 HTTP 协议版本使用情况剖析
  • 数字后端实现之Innovus中open net原因解析及解决方案
  • 硬编码(二)经典定长指令二
  • 自然语言处理NLP 04案例——苏宁易购优质评论与差评分析
  • Vue 和 React 的异同点
  • TTL和CMOS的区别【数电速通】
  • web网站接入Google Analytics
  • 晶闸管的串联使用
  • PyTorch-基础(CUDA、Dataset、transforms、卷积神经网络、VGG16)
  • python入门到精通,python入门基础语法,小白python入门教程
  • MySQL数据库(7)—— 内置函数
  • Screen Wonders for Mac v3.3.1 3D屏保应用 支持M、Intel芯片
  • spring笔记
  • ollama如何安全卸载,解决Ollama unins000.msg is missing
  • HTML 中的 Canvas 样式设置全解
  • LLM基础概念(RAG、微调流程、Prompt)
  • 【愚公系列】《Python网络爬虫从入门到精通》025-进程间通信
  • 网络运维学习笔记 017HCIA-Datacom综合实验01
  • pytest运行用例的常见方式及参数
  • 【登月计划】 DAY2 中期:产品研发与设计验证(4-6)--《设计图纸如何从电脑飞进生产线?揭秘研发系统的 “暗箱操作”》
  • CSS列表属性
  • go 网络编程 websocket gorilla/websocket
  • Ollama 安装
  • 【CI/CD】Jenkinsfile管理+参数化构建+邮件通知以及Jenkins + SonarQube 代码审查
  • 基于LM Arena 的 LLM 基准测试排行榜:DeepSeek-R1 排名第 5
  • Spring AI如何调用Function Calling
  • vue 学习-vite api.js