当前位置: 首页 > news >正文

Windows系统本地部署DeepSeek详细教程

最近DeepSeek非常火爆,因其卓越的推理能力和低成本特性而广受欢迎,DeepSeek开源了部分模型,通过蒸馏技术可以将大模型参数压缩为更小的版本(如1.5B、7B等),显著降低对显存和计算资源的需求,这使得普通家用电脑也能部署,无需依赖高端硬件。

本地部署不仅能规避网络延迟和隐私风险,还能根据需求定制模型功能,成为高效办公、学习研究的利器。 此外,本地部署使数据完全存储于自有服务器或私有云,避免第三方平台的数据泄露风险,尤其适用于医疗、金融等涉及敏感信息的行业。本文介绍如何在自己的电脑上本地部署 DeepSeek-R1-8B 模型。

目录

  • 1 硬件配置要求
  • 2 部署DeepSeek
    • 2.1 安装Ollama
    • 2.2 将Ollama模型保存路径设置到D盘
    • 2.3 让Ollama使用GPU
    • 2.4 下载DeepSeek模型
      • 2.4.1 下载deepseek-r1:8b
      • 2.4.2 运行模型并对话
  • 3 安装图形化界面
    • 3.1 Page Assist浏览器插件
    • 3.2 Chatbox
    • 3.3 AnythingLLM
  • 4 参考文档

1 硬件配置要求

DeepSeek推出了多款开源模型,覆盖从推理到创作的多元场景。特别是DeepSeek-R1系列,具有低成本、高效推理的优势,可在本地部署。此外还有将R1的推理能力迁移至小型模型的知识蒸馏模型,不同版本的DeepSeek模型的硬件需求根据参数规模和应用场景具有显著差异,下面是DeepSeek R1 不同版本模型的硬件要求:

模型版本参数量(B)RAM需求推荐 GPU(单卡)适用场景
DeepSeek-R1-671B671512GB+8x A100/H100(服务器集群)国家级/超大规模 AI 训练,超高性能计算
DeepSeek-R1-70B70128GB+2x A100 80GB/4x RTX 4090(多卡并行)科研机构/大型企业,大规模数据分析处理
DeepSeek-R1-32B3264GB+2x A100 40GB(24GB显存)高精度专业领域任务、多模态数据分析
DeepSeek-R1-14B1432GB+RTX 4090(24GB)/A5000(16GB显存)中型企业/科研团队/专业服务机构,企业级复杂任务(合同分析、报告生成)、长文本理解与生成
DeepSeek-R1-8B816GB+RTX 4070/3060/3070(12GB显存)需更高精度的轻量级任务(代码生成、逻辑推理)
DeepSeek-R1-7B716GB+RTX 3060/3070/4060(8GB显存)中等复杂度的逻辑推理和生成任务、轻量级多轮对话系统
DeepSeek-R1-1.5B1.58GB+GTX 1650(4GB显存)低资源设备的基础推理任务,如简单问答、文本摘要、轻量级数据分析

模型参数越大,对显存和内存需求越高,我的电脑系统为Windows11,内存为32GB,显卡为英伟达RTX 4060,本文部署DeepSeek-R1-8B模型。

2 部署DeepSeek

2.1 安装Ollama

Ollama是运行本地AI模型的核心工具,支持一键部署,支持Windows/macOS/Linux,本文在Windows下部署:

  1. 访问官网(https://ollama.com/),下载Windows版安装包OllamaSetup.exe
  2. 双击OllamaSetup.exe安装会默认安装到C盘,建议使用如下命令安装到其它盘:
$ cd D:\devWorkspace\AI_tools
$ OllamaSetup.exe  /DIR="D:\devWorkspace\AI_tools\Ollama"

  1. 安装完成后打开终端输入 ollama -v 验证是否成功。
$ ollama -v
ollama version is 0.5.12

2.2 将Ollama模型保存路径设置到D盘

添加环境变量OLLAMA_MODELS ,值为:D:\devWorkspace\AI_tools\Ollama\models

2.3 让Ollama使用GPU

为了让推理跑在GPU上,可设置环境变量OLLAMA_GPU_LAYER, 值为:cuda

如果需要指定特定的 GPU,可以添加以下环境变量:

变量名:CUDA_VISIBLE_DEVICES
变量值:GPU的UUID

可在控制台窗口输入 nvidia-smi -L 命令查看GPU的UUID:

$ nvidia-smi -L
GPU 0: NVIDIA GeForce RTX 4060 Laptop GPU (UUID: GPU-1ff78f94-b4af-2a60-cedf-cbaaa65beb38)

环境变量配置完成后需要重启一下电脑,让配置生效。

2.4 下载DeepSeek模型

2.4.1 下载deepseek-r1:8b

deepseek-r1各版本可在这里查看:https://ollama.com/library/deepseek-r1,使用Ollama命令行下载模型:

$ ollama pull deepseek-r1:8b
pulling manifest
pulling 6340dc3229b0... 100% ▕████████████████████████████████████████████████████████▏ 4.9 GB
pulling 369ca498f347... 100% ▕████████████████████████████████████████████████████████▏  387 B
pulling 6e4c38e1172f... 100% ▕████████████████████████████████████████████████████████▏ 1.1 KB
pulling f4d24e9138dd... 100% ▕████████████████████████████████████████████████████████▏  148 B
pulling 0cb05c6e4e02... 100% ▕████████████████████████████████████████████████████████▏  487 B
verifying sha256 digest
writing manifest
success

模型会下载到前面配置的目录下:D:\devWorkspace\AI_tools\Ollama\models

2.4.2 运行模型并对话

输入ollama run deepseek-r1:8b命令,然后输入问题与DeepSeek进行对话:

$ ollama run deepseek-r1:8b
>>> 请用Java语言写一个快速排序
<think>
嗯,我现在得想办法用Java来实现快速排序。首先,快速排序是什么呢?我记得它是基于分治策略的一种高效排序算法,平均时间复
杂度大概是O(n log n)对吧。那它的基本思想应该是,每次把数组分成两部分,一半较小,一半较大,然后递归地排序这两部分,对
吧。

那我得先想想怎么实现这个过程。快速排序通常有几个步骤:选择枢轴元素,partition,递归排序左右子数组。那在Java中,可能
需要写一个方法来处理这些步骤。

首先,选择枢轴是什么呢?常见的选择是中位数或者前导元素。比如,我可以选数组中的第一个元素作为枢轴,这样实现起来简单些
。那如何找到中位数呢?或许不一定需要精确找中位数,只要能保证枢轴位置正确就行。

然后,partition步骤,也就是将数组分成小于等于枢轴和大于枢轴的两部分。这个过程可以用双指针来实现:一个指针从左边开始
扫描找到第一个比枢轴大的元素,另一个指针从右边开始扫描找到第一个比枢轴小的元素,然后交换它们的位置。这样整个数组就被
分成了两部分。

接下来是递归排序左右子数组。我需要考虑如何处理这些子数组,比如确定起始和结束的索引,避免重复计算或者越界。

那我得想想怎么编写这个快速排序的方法。可能是一个静态的方法,接受数组和左、右索引作为参数。然后基线情况是什么呢?比如
,当左 >= 右的时候,说明子数组只包含一个或没有元素,此时不需要再进行分割了。

那我可能会写出以下结构:
.....

可使用 Ctrl + d 或者 /bye 退出会话。

3 安装图形化界面

使用命令行的方式不是很友好,可以安装一个WebUI,可用的交互界面有很多:

  1. Page Assist浏览器插件:https://github.com/n4ze3m/page-assist
  2. chatbox:https://github.com/Bin-Huang/chatbox
  3. AnythingLLM:https://anythingllm.com/desktop
  4. Open WebUI:https://openwebui-doc-zh.pages.dev/,需要使用docker运行

3.1 Page Assist浏览器插件

到这里下载https://github.com/n4ze3m/page-assist/releases,以Chrome插件为例,下载pageassist-1.5.3-chrome.zip,下载完成后,拖入Chrome浏览器扩展程序中。
在这里插入图片描述

3.2 Chatbox

到官网下载安装即可:https://chatboxai.app/zh#download

在设置中选择“Ollama API”,绑定本地模型。
在这里插入图片描述

在这里插入图片描述

3.3 AnythingLLM

AnythingLLM可用来构建私有知识库和智能问答系统,支持导入分析多种类型的文档,可以根据自己的需求创建不同的AI代理,实现高度定制化功能。

下载Windows桌面版双击安装即可:https://anythingllm.com/desktop

安装完成后选择Ollama:
在这里插入图片描述
配置完成后就可以进行聊天了。

可使用AnythingLLM来创建个人知识库,比如上传一个本地文档,添加到工作区,并嵌入到模型中。
在这里插入图片描述

4 参考文档

  1. https://articles.zsxq.com/id_a26ljl30vb8z.html
  2. https://github.com/deepseek-ai/DeepSeek-R1
  3. https://ollama.com/library/deepseek-r1
  4. https://www.deepseek.com/
  5. https://anythingllm.com/desktop
--THE END--

相关文章:

  • Ubuntu修改用户名
  • 朴素贝叶斯
  • AI人工智能-Python基础与程序流程控制
  • python正向先行断言讲解与举例
  • Javascript中的匿名函数
  • 基于单片机的农田智能驱鼠装置(论文+源码)
  • 第十七章:Python数据可视化工工具-Pyecharts库
  • Qt中的事件循环
  • “Error: Flash Download failed - Target DLL has been cancelled”
  • todesk控制端没声音 控制声音位置
  • 吴恩达深度学习复盘(2)神经网络的基本原理轮廓
  • ACM第二次排名赛
  • Java进阶——原生定时器
  • Python 爬虫(5)Beautiful Soup 4 实战
  • 数字隔离器选型与设计
  • 通过安当TDE透明加密实现ClickHouse数据库安全加密存储
  • 从失衡到平衡:手撕红黑树的插入旋转操作
  • 后端开发基础:语言选择与 RESTful API 设计
  • GET 和 POST 有什么区别
  • H3C交换机的配置 VLAN间通信及网关部署在三层交换机
  • 提供微网站制作多少钱/百度软件安装
  • 熊掌号网站怎么做/美国疫情最新数据消息
  • b2b网站建设公司/作品提示优化要删吗
  • 东莞做公司网站/怎么做一个网站页面
  • 期末网站设计做什么网站比较好/网站推广步骤
  • 做网站的公司叫什么软件/百度资源共享