当前位置: 首页 > news >正文

在docker容器中运行Ollama部署deepseek-r1大模型

# 启动ollama容器
docker run -itd --gpus=all -v /app/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:0.5.12


# 进入容器
docker exec -it ollama bash
## 拉取大模型(7B为例)
ollama pull deepseek-r1:7b

## 修改监听地址和端口
export OLLAMA_HOST=0.0.0.0:11434

## 运行deepseek-r1:7b
ollama run deepseek-r1:7b

# 此时可以本地问答,也可以使用api发起请求


# 另外起open-webui容器服务
docker run -it --rm -p 18080:8080 \
-v /app/open-webui/data:/app/backend/data \
--add-host=host.docker.internal:host-gateway \
-e ENABLE_OLLAMA_API=False \
--name open-webui\
ghcr.io/open-webui/open-webui:main

api测试:

curl -X 'POST' \
  'http://localhost:11434/v1/chat/completions' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
  "messages": [
    {
      "content": "你是谁?",
      "role": "user"
    }
  ],
  "model": "deepseek-r1:7b",
  "stream": true
}'

open-webui接入ollama api

访问http://主机IP:18080

相关文章:

  • 做搜索引擎优化网站费用创建一个网站
  • 哪几个网站做acm题目比较好阳泉seo
  • 云南商城网站建设女教师遭网课入侵直播录屏曝光8
  • 网站怎么做动态图片口碑营销的缺点
  • 做外贸网站租什么服务器苏州首页排名关键词优化
  • 网站后台管理系统 asp市场营销策划方案书
  • C# String 常用操作方法详解
  • 检查SSH安全配置-sshd服务端未认证连接最大并发量配置
  • React Native 核心技术知识点快速入门
  • 用大白话解释日志处理Log4j 是什么 有什么用 怎么用
  • 45.matlab产生正弦叠加信号并保存为txt文本
  • 智能驾驶ai算法学习路线图
  • C# 使用 Newtonsoft.Json 序列化和反序列化对象实例
  • 冒泡排序算法优化
  • Spring Security是什么?如何使用Spring Security进行安全控制?
  • 如何查看react的版本号
  • 计算机网络 第一章 概述(Overview)
  • 《机器学习数学基础》补充资料:矩阵的LU分解
  • 【解决】OnTriggerEnter/OnTriggerExit 调用匿名委托误区的问题
  • Wireshark:自定义类型帧解析
  • el-switch切换之前二次确认
  • HarmonyOS NEXT组件深度全解:十大核心组件开发指南与实战
  • 三个小时学完vue3 —— 简单案例(二)
  • 力扣 划分字母区间
  • linux有哪些常用命令?
  • 华为在不同发展时期的战略选择(节选)