当前位置：首页 > news >正文

red hat系统离线部署Deepseek

news 2025/10/16 13:50:29

一个人在单位离线部署踩了不少坑，记录一下

模型准备

1.huggingface下载gguf文件，将文件放到相应目录(例如E:/AI文件夹)
2.在文件夹内用文本建一个文件，命名Modelfile(删除txt后缀)
3.用文本编辑器打开Modelfile，在文本内输入 from ./模型名称.gguf 然后保存
4.在放模型的文件夹内，点击右键-点击·在终端中打开·然后输入 ollama create 模型名称 -f./modelfile按 Enter健就会进行转换

Ollama
docker pull ollama:lastest
运行ollama
docker run -p 11434:11434 -v /home:/root/.ollama/models ollama/ollama:latest
因为默认模型地址不够70b大小，-v /home:/root/.ollama/models意思将模型放到/home目录下
执行curl 172.13.1.1:11434，回复ollama is running

工程挂载

使用的open-webui
https://docs.openwebui.com/getting-started/quick-start/
拉镜像
docker pull ghcr.io/open-webui/open-webui:cuda
运行镜像(以下方式才能识别到虚拟机里运行的ollama，不然Open WebUI识别不到本地ollama中的模型)
docker run -d -p 3000:8000 -v open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://172.13.1.1:11434 --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda

浏览器输入172.13.1.1:3000进入openwebui官网

http://www.dtcms.com/a/58173.html

相关文章：

文本处理Bert面试内容整理-BERT的应用场景有哪些？

SpringBoot集成MQ，四种交换机的实例

nginx部署问题

【RocketMQ】二、架构与核心概念

Redis- 大key

【深度学习】宠物品种分类Pet Breeds Classifier

uniapp+node+mysql接入deepseek实现流式输出

mybatis-plus+springboot3项目实现分页

【自学笔记】Numpy基础知识点总览-持续更新

linux上安装redis[从0到1]

【AGI】通往AGI的复兴号：模型工具演进与技术路径优化

03特征值分解

软件测试の概念之测试分类质量模型测试用例

渗透测试之利用sql拿shell（附完整流程+防御方案）【上】

Visual studio + Qt 项目配置管理

UI自动化测试Selenium安装教程（1）

《加快应急机器人发展的指导意见》中智能化升级的思考——传统应急设备智能化升级路径与落地实践

【JavaEE】网络原理

FPGA学习篇——Verilog学习5（reg，wire区分及模块例化）

【洛谷P1080国王游戏】2025-3-7

K8S学习之基础十三：k8s中ReplicaSet的用法

VUE3开发-4、组件引入

《A++ 敏捷开发》- 18 软件需求

java 重点知识 — JVM存储模块与类加载器

js基本功（五）

【Linux网络#13】：网络层（IP 协议网络通信全球网络路由转发）

STM32F4 UDP组播通信：填一填ST官方HAL库的坑

【JAVA架构师成长之路】【电商系统实战】第12集：秒杀系统性能优化实战（CAN + Nginx + Sentinel）

Myslq表的内外连接

tomcat安装