当前位置: 首页 > news >正文

使用 Ollama 本地部署 DeepSeek 模型及 Chatbox 配置

文章目录

  • Github
  • 官网
  • 简介
  • 安装
  • 基础命令
  • 模型下载
  • 运行模型
  • 测试模型
    • API文档
    • 常用API
    • Generate 响应
    • Python Generate 示例
    • Chat 响应
    • Python Chat 示例
  • Chatbox
  • Mac 开放局域网访问

Github

  • https://github.com/ollama/ollama

官网

  • https://ollama.com/

简介

Ollama 是一个本地化大语言模型运行框架,主要特点包括:

  • 支持在本地运行 Llama 3、Mistral、DeepSeek 等主流大模型
  • 提供REST API接口(如您代码中的 base_url 配置)
  • 支持多平台(MacOS/Linux/Windows)
  • 内置模型库管理功能

安装

在这里插入图片描述

  • 验证是否安装成功
ollama -v
# 监听 Ollama 服务端口
lsof -i :11434 | grep LISTEN

基础命令

# 下载模型到本地
ollama pull deepseek-r1:1.5b
# 列出已有的模型
ollama list
# 运行指定模型
ollama run deepseek-r1:1.5b
ollama run deepseek-r1:7b
# 删除本地模型
ollama rm deepseek-r1:7b

模型下载

  • https://ollama.com/library/deepseek-r1
    在这里插入图片描述
    在这里插入图片描述

注:本地资源有限就只下载了 1.5b 版本。

运行模型

ollama list
ollama run deepseek-r1:1.5b

在这里插入图片描述

注:首次执行会先下载模型;按 Ctr + d 停止运行

测试模型

API文档

  • https://github.com/ollama/ollama/blob/main/docs/api.md

常用API

  • http://127.0.0.1:11434
    在这里插入图片描述
  • http://127.0.0.1:11434/api/tags
    在这里插入图片描述
  • http://127.0.0.1:11434/api/ps
    在这里插入图片描述

Generate 响应

  • http://127.0.0.1:11434/api/generate
curl http://127.0.0.1:11434/api/generate \
 -H "Content-Type: application/json" \
 -d '{
      "model": "deepseek-r1:1.5b",
      "prompt": "你好",
      "stream": false
    }' \
 --max-time 30 \
 --no-buffer

在这里插入图片描述

Python Generate 示例

import requests
import json

API_URL = "http://localhost:11434/api/generate"

def Demo1():
    data = {
        "model": "deepseek-r1:1.5b",
        "system": "You are a helpful assistant, and you only speak Chinese.",
        "prompt": "你好",
        "stream": False
    }

    response = requests.post(API_URL, json=data)
    print(response)
    json_response = response.json()
    print(json.dumps(json_response, indent=2, ensure_ascii=False))
    print(json_response.get("response", "").strip())

if __name__ == "__main__":
    Demo1()

Chat 响应

  • http://127.0.0.1:11434/api/chat
curl http://127.0.0.1:11434/api/chat \
 -H "Content-Type: application/json" \
 -d '{
      "model": "deepseek-r1:1.5b",
      "messages": [
        {"role": "system", "content": "You are a helpful assistant, and you only speak Chinese."},
        {"role": "user", "content": "你好"}
      ],
      "stream": false
    }' \
 --max-time 30 \
 --no-buffer

在这里插入图片描述

Python Chat 示例

import requests
import json

API_URL = "http://localhost:11434/api/chat"

def Demo1():
    data = {
        "model": "deepseek-r1:1.5b",
        "messages": [
            {"role": "system", "content": "You are a helpful assistant, and you only speak Chinese."},
            {"role": "user", "content": "你好"}
        ],
        "stream": False
    }

    response = requests.post(API_URL, json=data)
    print(response)
    json_response = response.json()
    print(json.dumps(json_response, indent=2, ensure_ascii=False))
    print(json_response['message']['content'])

if __name__ == "__main__":
    Demo1()
  • 响应内容
{
  "model": "deepseek-r1:1.5b",
  "created_at": "2025-03-20T15:10:32.605318Z",
  "message": {
    "role": "assistant",
    "content": "<think>\n\n</think>\n\n你好!有什么我可以帮助你的吗?"
  },
  "done_reason": "stop",
  "done": true,
  "total_duration": 1046775688,
  "load_duration": 25081968,
  "prompt_eval_count": 16,
  "prompt_eval_duration": 69998462,
  "eval_count": 13,
  "eval_duration": 950691930
}

Chatbox

  • https://chatboxai.app/zh

Chatbox AI 是一款 AI 客户端应用和智能助手,支持众多先进的 AI 模型和 API,可在 Windows、MacOS、Android、iOS、Linux 和网页版上使用。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Mac 开放局域网访问

# 强制关闭 Ollama
sudo pkill -9 ollama 
  • 使用正确的Ollama配置创建plist文件
echo '<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
<plist version="1.0">
<dict>
    <key>Label</key>
    <string>ollama</string>
    <key>ProgramArguments</key>
    <array>
        <string>/bin/bash</string>
        <string>-c</string>
        <string>export OLLAMA_HOST="0.0.0.0:11434" && /usr/local/bin/ollama serve</string>
    </array>
    <key>RunAtLoad</key>
    <true/>
    <key>KeepAlive</key>
    <true/>
</dict>
</plist>' > ~/Library/LaunchAgents/ollama.plist
  • 设置权限并重新加载服务
chmod 644 ~/Library/LaunchAgents/ollama.plist
launchctl unload ~/Library/LaunchAgents/ollama.plist 2>/dev/null
launchctl load ~/Library/LaunchAgents/ollama.plist
  • 启启 Ollama 服务后
lsof -i :11434 | grep LISTEN

在这里插入图片描述

  • 局域网内访问测试
curl http://192.168.0.100:11434/api/generate \
 -H "Content-Type: application/json" \
 -d '{
      "model": "deepseek-r1:1.5b",
      "prompt": "你好",
      "stream": false
    }' \
 --max-time 30 \
 --no-buffer

相关文章:

  • poetry安装与使用
  • IoTDB日志提示Too many open files
  • 华为总部-华为东莞松山湖基地参观游学攻略
  • ragflow 默认端口被占用,更改端口号
  • C# MethodBase 类使用详解
  • 蓝桥每日打卡--区间移位
  • ReentranLock手写
  • Three.js中的加载器与资源管理:构建丰富3D场景的关键
  • 【 <二> 丹方改良:Spring 时代的 JavaWeb】之 Spring Boot 中的 RESTful API 设计:从上手到骨折
  • Oracle 常用语法汇总
  • Hinton提出的知识蒸馏(Knowledge Distillation,简称KD):原理解释和代码实现
  • LeetCode 解题思路 23(Hot 100)
  • 炫酷的3D按钮效果实现 - CSS3高级特性应用
  • 线性代数(期末周救济)--笔记1
  • 中文文献去哪里查找,个人下载知网、万方、维普文献途径
  • HFSS 使用指南 —— 新手项目完整实现步骤
  • C/C++错误信息
  • 【第19节】windows sdk编程:文件I/O
  • 前缀和算法的应用
  • 使用crontab设置程序自启动
  • 学者三年实地调查被判AI代笔,论文AI率检测如何避免“误伤”
  • 网易有道一季度净利润同比增长247%:有能力在今年实现更强劲的利润增长
  • 征稿启事|澎湃·镜相第三届非虚构写作大赛暨2026第六届七猫现实题材征文大赛
  • 我国城市规划“全面体检”套餐出台,城市体检将逐步与供地计划等挂钩
  • 持续8年仍难终了的纠纷:败诉方因拒执罪被立案,胜诉方银行账户遭冻结
  • 沈阳卫健委通报“健康证”办理乱象:涉事医院已被立案查处