当前位置: 首页 > news >正文

DeepSeek 本地部署及深度使用

DeepSeek 是一款国产的大型语言模型,因其在自然语言处理、代码生成和多轮对话等任务中的出色表现,迅速引起了广泛关注。为了避免因服务器繁忙导致的使用不便,您可以选择将 DeepSeek 部署在本地,这样无需依赖云端服务即可享受 AI 带来的便利。

简介

DeepSeek 是一家中国初创企业,因其高性能、低成本的生成式 AI 大规模语言模型而备受关注。其最新发布的模型“R1”在推理能力上进行了强化学习,展现出了与 OpenAI 的 GPT-4 相当的性能。 在代码能力方面,DeepSeek 的 DeepSeek-V3 模型在 Aider 代码能力排行榜中取得了 48.4% 的正确率,仅次于 OpenAI 的 o1,超过了 Claude 3.5 Sonnet。

Deepseek的跑分对比(图片来自官网):
图片来自官网

DeepSeek 本地部署指南

如果你希望在本地环境中部署DeepSeek,以下是一些详细的步骤和注意事项:

1. 准备硬件环境

  • 处理器/GPU:确保你的服务器或工作站配备至少一个高性能的GPU(如NVIDIA显卡),因为深度学习任务通常需要大量的计算
    资源。

  • 内存:建议至少有8GB以上的内存,具体需求取决于你要处理的数据量和模型规模。

  • 存储空间:提供足够的存储空间来下载或存储训练数据、预训练模型以及其他相关文件。如果你在本地进行数据处理和训练,还需要考虑到存储需求的增长。

2. 安装必要软件

安装 Ollama: Ollama 是一款开源的本地大模型运行工具,支持多种操作系统。您可以访问其官网 ollama.com下载适用于您操作系统的安装包。安装完成后,打开命令提示符(Windows)或终端(macOS、Linux),输入 ollama help 并按回车键,以验证安装是否成功。
在这里插入图片描述

3.下载并部署 DeepSeek 模型

在 Ollama 官网的搜索栏中输入 deepseek-r1,选择适合您硬件配置的模型版本。不同版本对硬件的要求不同,您可以参考以下配置:

模型版本参数量显存需求(FP16)推荐 GPU(单卡)适用场景
DeepSeek-R1-1.5B15亿3GBGTX 1650(4GB 显存)低资源设备部署、实时文本生成
DeepSeek-R1-7B70亿14GBRTX 3070/4060(8GB 显存)中等复杂度任务、轻量级多轮对话系统
DeepSeek-R1-8B80亿16GBRTX 4070(12GB 显存)需更高精度的轻量级任务
DeepSeek-R1-14B140亿32GBRTX 4090/A5000(16GB 显存)企业级复杂任务、长文本理解与生成

选择合适的模型后,复制相应的命令,在命令提示符或终端中粘贴并运行,以下载并部署模型。下载完成后,您可以通过命令 ollama run deepseek-r1 来运行模型。
在这里插入图片描述

4. 使用可视化界面(可选)

为了获得更友好的交互体验,您可以使用 Chatbox 这类可视化图文交互界面。访问
chatboxai.com,选择适合的版本进行安装。安装完成后,在设置中选择使用本地模型,并配置为使用 Ollama 提供的 DeepSeek 模型。这样,您就可以通过图形界面与模型进行交互。

  • 知乎: DeepSeek使用chatbox

相关文章:

  • 本地部署【LLM-deepseek】大模型 ollama+deepseek/conda(python)+openwebui/docker+openwebui
  • Linux自旋锁:探秘内核同步利器
  • [MySQL]1-MySQL结构与运行原理
  • 《刚刚问世》系列初窥篇-Java+Playwright自动化测试-22- 操作鼠标拖拽 - 下篇(详细教程)
  • Django在终端创建项目(pycharm Windows)
  • 区块链+隐私计算:长安链多方计算合约标准协议(CMMPC-1)发布
  • @JsonRawValue 注解
  • Bash 中的运算方式
  • 【Linux】【进程】epoll内核实现
  • uniapp 使用 鸿蒙开源字体
  • Go框架面试突击!30道高频题解析
  • 将 AMD Zynq™ RFSoC 扩展到毫米波领域
  • 探索Java中的集合类_特性与使用场景
  • Git 与持续集成 / 持续部署(CI/CD)的集成
  • 20250213 隨筆 雪花算法
  • 在使用 uni.getLocation 步骤和一些坑
  • MySQL中类似PostgreSQL中的string_agg函数--GROUP_CONCAT函数的使用
  • Go 语言调用 SiliconFlow 的 Deepseek AI Janus-Pro-7B 模型进行图像生成
  • 路由过滤方法与常用工具
  • 前端开发工程中如何利用DeepSeek提升工作效率:实战案例与策略解析
  • 中消协点名新能源汽车行业:定金退款争议频发
  • 特色茶酒、非遗挂面……六安皋品入沪赴“五五购物节”
  • 金融监管总局将推出8项增量政策:涉房地产金融、险资入市、稳外贸等
  • 潘功胜:央行将设立5000亿元服务消费与养老再贷款
  • 加拿大总理访美与特朗普“礼貌交火”
  • 网友建议平顶山请刘昊然任旅游宣传大使,市委:有此设想,正申请经费