当前位置: 首页 > news >正文

red hat系统离线部署Deepseek

一个人在单位离线部署踩了不少坑,记录一下

模型准备

1.huggingface下载gguf文件,将文件放到相应目录(例如E:/AI文件夹)
2.在文件夹内用文本建一个文件,命名Modelfile(删除txt后缀)
3.用文本编辑器打开Modelfile,在文本内输入 from ./模型名称.gguf 然后保存
4.在放模型的文件夹内,点击右键-点击·在终端中打开·然后输入 ollama create 模型名称 -f./modelfile按 Enter健 就会进行转换

Ollama
docker pull ollama:lastest
运行ollama
docker run -p 11434:11434 -v /home:/root/.ollama/models ollama/ollama:latest
因为默认模型地址不够70b大小,-v /home:/root/.ollama/models意思将模型放到/home目录下
执行curl 172.13.1.1:11434,回复ollama is running

工程挂载

使用的open-webui
https://docs.openwebui.com/getting-started/quick-start/
拉镜像
docker pull ghcr.io/open-webui/open-webui:cuda
运行镜像(以下方式才能识别到虚拟机里运行的ollama,不然Open WebUI识别不到本地ollama中的模型)
docker run -d -p 3000:8000 -v open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://172.13.1.1:11434 --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda

浏览器输入172.13.1.1:3000进入openwebui官网

http://www.dtcms.com/a/58173.html

相关文章:

  • 文本处理Bert面试内容整理-BERT的应用场景有哪些?
  • SpringBoot集成MQ,四种交换机的实例
  • nginx部署问题
  • 【RocketMQ】二、架构与核心概念
  • Redis- 大key
  • 【深度学习】宠物品种分类Pet Breeds Classifier
  • uniapp+node+mysql接入deepseek实现流式输出
  • mybatis-plus+springboot3项目实现分页
  • 【自学笔记】Numpy基础知识点总览-持续更新
  • linux上安装redis[从0到1]
  • 【AGI】通往AGI的复兴号:模型工具演进与技术路径优化
  • 03特征值分解
  • 软件测试の概念之测试分类质量模型测试用例
  • 渗透测试之利用sql拿shell(附完整流程+防御方案)【上】
  • Visual studio + Qt 项目配置管理
  • UI自动化测试Selenium安装教程(1)
  • 《加快应急机器人发展的指导意见》中智能化升级的思考——传统应急设备智能化升级路径与落地实践
  • 【JavaEE】网络原理
  • FPGA学习篇——Verilog学习5(reg,wire区分及模块例化)
  • 【洛谷P1080国王游戏】2025-3-7
  • K8S学习之基础十三:k8s中ReplicaSet的用法
  • VUE3开发-4、组件引入
  • 《A++ 敏捷开发》- 18 软件需求
  • java 重点知识 — JVM存储模块与类加载器
  • js基本功(五)
  • 【Linux网络#13】:网络层(IP 协议 网络通信 全球网络 路由转发)
  • STM32F4 UDP组播通信:填一填ST官方HAL库的坑
  • 【JAVA架构师成长之路】【电商系统实战】第12集:秒杀系统性能优化实战(CAN + Nginx + Sentinel)
  • Myslq表的内外连接
  • tomcat安装