当前位置: 首页 > news >正文

DeepSeek 本地化部署与 WebUI 配置的方法

环境准备

  • 硬件要求 :推荐 Linux 操作系统,如 Ubuntu 20.04 及以上版本。内存至少 16GB,显存至少 8GB,SSD 硬盘空间至少 50GB,有支持 CUDA 的 NVIDIA GPU 更佳,推荐显存 16GB 及以上。
  • 软件依赖 :需要安装 Python 3.8 及以上版本,以及 pip 包管理工具。根据 NVIDIA GPU 型号和驱动版本,安装合适的 CUDA(11.2 及以上版本)和 cuDNN(8.1 及以上版本)。

安装部署

  • 安装 PyTorch :根据 CUDA 版本选择合适的 PyTorch 安装命令。例如,CUDA 11.2 的安装命令如下:
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu112
  • 克隆代码库及安装依赖
git clone https://github.com/deepseek-ai/deepseek.git
cd deepseek
pip install -r requirements.txt
  • 下载模型并配置路径 :从官方提供的链接下载 DeepSeek 模型权重,放置在 models/目录下,并设置模型路径和 GPU 设备号等环境变量:
export MODEL_PATH=models/deepseek_model.pth
export CUDA_VISIBLE_DEVICES=0

WebUI 配置

  • 使用 Open WebUI
    • 参考,先通过代码下载动态量化后的 DeepSeek 模型,如 1.58 bit 量化模型。
    • 编译并运行 llama.cpp,使用 llama-server 命令启动服务,如:
export LD_LIBRARY_PATH=$(pwd)/build/bin:$LD_LIBRARY_PATH
./build/bin/llama-server --model ./DeepSeek-R1-GGUF/DeepSeek-R1-UD-IQ1_S/DeepSeek-R1-UD-IQ1_S-00001-of-00003.gguf --host 0.0.0.0 --port 10000 --ctx-size 32768 --n-gpu-layers 61
* 将量化版模型服务接入 Open WebUI,点击左下角用户图标,进入管理员面板,依次点击 “设置”->“外部连接”->“管理 OpenAI API 连接”->“添加一个连接”,填入服务器 IP 和端口等信息。  
  • 使用 Ollama 配合 Chatbox
    • 安装 Ollama 后,通过命令行下载 DeepSeek-R1 模型,如 ollama run deepseek-r1:8b。
    • 下载安装 Chatbox,打开 Chatbox,选择设置 ->Ollama API,选择已安装的 DeepSeek-R1 模型并保存。
  • 使用 Open-WebUI :先安装 Docker,再通过以下命令安装 Open-WebUI:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

安装完成后,访问http://localhost:3000,注册登录后选择对应的 DeepSeek 模型即可开始对话。

相关文章:

  • 应用服务器-IIS
  • 深度学习---pytorch搭建深度学习模型(附带图片五分类实例)
  • 《算法笔记》10.5小节——图算法专题->最小生成树 问题 E: Jungle Roads
  • Vue高级特性实战:自定义指令、插槽与路由全解析
  • [论文阅读]Adversarial Semantic Collisions
  • “兴火·燎原”总冠军诞生,云宏信息《金融高算力轻量云平台》登顶
  • 第十六届蓝桥杯 2025 C/C++B组第一轮省赛 全部题解(未完结)
  • 【软考-高级】【信息系统项目管理师】【论文基础】沟通管理过程输入输出及工具技术的使用方法
  • 语音合成之十韵律之美:TTS如何模拟语音的节奏和语调
  • 第十六届蓝桥杯 C/C++ B组 题解
  • 沙箱逃逸(Python沙盒逃逸深度解析)
  • 7.进程概念(三)
  • 01_微服务常见问题
  • k8s术语pod
  • 解决vue3 路由query传参刷新后数据丢失的问题
  • Webug4.0通关笔记04- 第6关宽字节注入
  • FPGA中级项目7———TFT显示与驱动
  • gitmodule怎么维护
  • LeetCode:55.跳跃游戏——局部最优并非全局最优!
  • 如何个人HA服务器地址和长期密钥
  • 中国银行副行长刘进任该行党委副书记
  • 83岁连丽如每周登台说书,还上了15堂连派评书课
  • 央行召开落实金融“五篇大文章”总体统计制度动员部署会议
  • 外交部:印度香客赴中国西藏神山圣湖朝圣将于今年夏季恢复
  • 民生访谈|宝妈宝爸、毕业生、骑手……上海如何为不同人群提供就业保障
  • 绵阳造AI机器狗参与警务工作,演练中辅助民警控制“嫌疑人员”