当前位置: 首页 > news >正文

docker离线部署gpt-oss-20b流程,从下载到安装再到可以使用

背景:内网环境使用大模型前的准备

临时保存搜索的安装步骤

  • 联网
    • windows系统我选择安装docker desktop
      • 安装好后,需要跟着docker destop提示下载子系统linux
    • docker hub中搜索可用镜像
# 1. 下载 Docker 镜像(需联网)
docker pull ollama/ollama# 2. 导出镜像为离线包
docker save ollama/ollama -o ollama-image.tar# 3. 下载模型文件(需联网)
ollama pull gpt-oss:20b# 4. 导出模型为离线包
ollama export gpt-oss:20b ./gpt-oss-20b-model.tar
  • 离线
# 1. 传输文件到离线服务器
scp ollama-image.tar user@offline-server:/data
scp gpt-oss-20b-model.tar user@offline-server:/data# 2. 加载 Docker 镜像
docker load -i /data/ollama-image.tar# 3. 导入模型
mkdir -p /mnt/models
docker run -it -v /mnt/models:/root/.ollama ollama/ollama ollama import /data/gpt-oss-20b-model.tar# 4. 启动服务(带 GPU 支持)
docker run -d \--name ollama_gpt \--gpus all \-v /mnt/models:/root/.ollama \-p 11434:11434 \ollama/ollama
  • 验证服务
# 1. 检查容器状态
docker logs ollama_gpt | grep "model loaded"# 2. 发送测试请求(JSON 格式)
curl -s http://localhost:11434/api/generate -d '{"model": "gpt-oss:20b","prompt": "Docker离线部署的优势","stream": false
}' | jq .response# 预期输出:
# "Docker离线部署可在隔离环境中运行模型,无需依赖外部网络..."
  • 资源优化配置根据设备显存调整 GPU 层数:
# 高端 GPU(40GB+)
docker exec ollama_gpt ollama run gpt-oss:20b --gpu-layers 35# 中端 GPU(24GB)
docker exec ollama_gpt ollama run gpt-oss:20b --gpu-layers 20# 纯 CPU 模式(量化版本)
docker exec ollama_gpt ollama run gpt-oss:20b-q4_0
  • 常见问题排查
    在这里插入图片描述

拓展

  • windows desktop占用c盘空间,迁移到其他盘符
    在这里插入图片描述
  • 配置docker desktop阿里镜像加速器
    • 登录你的阿里云账号,访问这个链接, 将如下内容加到配置中
      在这里插入图片描述
{"registry-mirrors": ["https://1i***n.mirror.aliyuncs.com"]
}
http://www.dtcms.com/a/395126.html

相关文章:

  • 关系数据库MySQL的常用基础命令详解实战
  • 面向动态环境的MEC突破:MLGO微算法科技推出自适应权重深度确定性策略梯度(AWDDPG)算法,革新多用户任务迁移技术
  • Ansys Zemax | 确保自由曲面设计的可制造性
  • 智造新势力:看“文化+科技”如何重塑制造新范式
  • 【算法训练营Day25】动态规划part1
  • 打破网络壁垒:使用内网穿透轻松实现远程桌面访问
  • 2025 PyCharm IDE 社区版与专业版合并后,新手该如何安装?(附 Toolbox 图形化安装教程)
  • 07-css元素定位布局
  • 波动率曲面及SVI模型的Python数值拟合
  • 基于Python新闻平台的文本数据挖掘系统
  • 2017/12 JLPT听力原文 问题四
  • 【Tawk】Tawk.to聊天小部件移动端位置调整完整指南
  • jieba 库
  • 开启 3D 之旅 - 你的第一个 WebGL 三角形
  • 基于AWS Lambda的机器学习动态定价系统 CI/CD管道部署方案介绍
  • 3D 文件格式解释
  • 对Hive表进行归档,减少小文件的影响
  • R 中,geo 数据集 分析探针转基因的时候,一个探针对应的多个基因的情况
  • 机器学习-逻辑回归-考试预测通过-1
  • 计算机中用8位如何计算最大值和最小值-128~127
  • PyTorch 神经网络工具箱完全指南
  • docker一键安装部署若依Ruoyi-Vue(保姆级)
  • 通义DeepResearch论文六连发全面解读
  • 大模型应用-prompt提示词工程
  • Windows 命令行:使用路径名和文件名来启动文件
  • 稻瘟病监测仪的功能用途
  • 仿照豆包实现 Prompt 变量模板输入框
  • 如何安装 SQLPro Studio for Mac?v2024.21.dmg 文件安装步骤详解(附安装包)
  • 扣子空间:字节跳动推出的AI Agent 智能体平台
  • 编程基础:表驱动