当前位置：首页 > news >正文

docker离线部署gpt-oss-20b流程，从下载到安装再到可以使用

news 2025/9/23 8:31:16

背景：内网环境使用大模型前的准备

临时保存搜索的安装步骤

联网
- windows系统我选择安装docker desktop
  - 安装好后，需要跟着docker destop提示下载子系统linux
- docker hub中搜索可用镜像

# 1. 下载 Docker 镜像（需联网）
docker pull ollama/ollama# 2. 导出镜像为离线包
docker save ollama/ollama -o ollama-image.tar# 3. 下载模型文件（需联网）
ollama pull gpt-oss:20b# 4. 导出模型为离线包
ollama export gpt-oss:20b ./gpt-oss-20b-model.tar

离线

# 1. 传输文件到离线服务器
scp ollama-image.tar user@offline-server:/data
scp gpt-oss-20b-model.tar user@offline-server:/data# 2. 加载 Docker 镜像
docker load -i /data/ollama-image.tar# 3. 导入模型
mkdir -p /mnt/models
docker run -it -v /mnt/models:/root/.ollama ollama/ollama ollama import /data/gpt-oss-20b-model.tar# 4. 启动服务（带 GPU 支持）
docker run -d \--name ollama_gpt \--gpus all \-v /mnt/models:/root/.ollama \-p 11434:11434 \ollama/ollama

验证服务

# 1. 检查容器状态
docker logs ollama_gpt | grep "model loaded"# 2. 发送测试请求（JSON 格式）
curl -s http://localhost:11434/api/generate -d '{"model": "gpt-oss:20b","prompt": "Docker离线部署的优势","stream": false
}' | jq .response# 预期输出：
# "Docker离线部署可在隔离环境中运行模型，无需依赖外部网络..."

资源优化配置根据设备显存调整 GPU 层数：

# 高端 GPU（40GB+）
docker exec ollama_gpt ollama run gpt-oss:20b --gpu-layers 35# 中端 GPU（24GB）
docker exec ollama_gpt ollama run gpt-oss:20b --gpu-layers 20# 纯 CPU 模式（量化版本）
docker exec ollama_gpt ollama run gpt-oss:20b-q4_0

常见问题排查

拓展

windows desktop占用c盘空间，迁移到其他盘符
配置docker desktop阿里镜像加速器
- 登录你的阿里云账号，访问这个链接, 将如下内容加到配置中

{"registry-mirrors": ["https://1i***n.mirror.aliyuncs.com"]
}

查看全文

http://www.dtcms.com/a/395126.html

关系数据库MySQL的常用基础命令详解实战

面向动态环境的MEC突破：MLGO微算法科技推出自适应权重深度确定性策略梯度（AWDDPG）算法，革新多用户任务迁移技术

Ansys Zemax | 确保自由曲面设计的可制造性

智造新势力：看“文化+科技”如何重塑制造新范式

【算法训练营Day25】动态规划part1

打破网络壁垒：使用内网穿透轻松实现远程桌面访问

2025 PyCharm IDE 社区版与专业版合并后，新手该如何安装？（附 Toolbox 图形化安装教程）

07-css元素定位布局

波动率曲面及SVI模型的Python数值拟合

基于Python新闻平台的文本数据挖掘系统

2017/12 JLPT听力原文问题四

【Tawk】Tawk.to聊天小部件移动端位置调整完整指南

jieba 库

开启 3D 之旅 - 你的第一个 WebGL 三角形

基于AWS Lambda的机器学习动态定价系统 CI/CD管道部署方案介绍

3D 文件格式解释

对Hive表进行归档,减少小文件的影响

R 中，geo 数据集分析探针转基因的时候，一个探针对应的多个基因的情况

机器学习-逻辑回归-考试预测通过-1

计算机中用8位如何计算最大值和最小值-128~127

PyTorch 神经网络工具箱完全指南

docker一键安装部署若依Ruoyi-Vue（保姆级）

通义DeepResearch论文六连发全面解读

大模型应用-prompt提示词工程

Windows 命令行：使用路径名和文件名来启动文件

稻瘟病监测仪的功能用途

仿照豆包实现 Prompt 变量模板输入框

如何安装 SQLPro Studio for Mac？v2024.21.dmg 文件安装步骤详解（附安装包）

扣子空间：字节跳动推出的AI Agent 智能体平台

编程基础：表驱动

临时保存搜索的安装步骤

拓展

相关文章：