当前位置: 首页 > news >正文

本地部署 DeepSeek R1 的几种常见方法

本地部署 DeepSeek R1 的几种常见方法

      • 使用 Ollama 部署
      • 使用量化模型部署
      • 使用 Docker 部署(推荐)
      • 硬件与性能要求
      • 其他工具

使用 Ollama 部署

  1. 安装 Ollama:访问 Ollama 官网,根据系统类型下载并安装。
  2. 启动 Ollama:安装完成后,在开始菜单中找到 Ollama 图标启动。
  3. 下载并运行模型
    • 打开命令行工具(如 CMD 或 PowerShell)。
    • 输入命令 ollama run deepseek-r1:{model_size},其中 {model_size} 可根据硬件配置选择,如 8b14b32b
    • 如果是首次运行,Ollama 会自动下载模型文件。
  4. 测试模型:下载完成后,输入问题(如“介绍一下你自己”)与模型进行对话。
  5. ollama命令
    与模型对话:
    ollama run deepseek-r1:1.5b
    ollama run deepseek-r1:8b
    
    查看已安装的模型:
    ollama list
    
    删除模型:
    ollama rm deepseek-r1:1.5b
    

使用量化模型部署

  1. 下载量化模型
    • 选择合适的量化版本(如 Q4_K_M),可从社区提供的链接下载。
    • 例如,使用 git clonegit lfs pull 命令下载 Q4_K_M 版本。
  2. 加载模型
    • 使用工具如 llama-cli,指定模型文件路径并启用交互模式。
    • 示例命令:build/bin/llama-cli -m /tmp/DeepSeek-R1-Q4_K_M/DeepSeek-R1-Q4_K_M-00001-of-00009.gguf -i

使用 Docker 部署(推荐)

  1. 安装 Docker:确保系统已安装 Docker。
  2. 拉取模型镜像
    • 使用命令 docker pull {model_image},其中 {model_image} 是 DeepSeek R1 的镜像地址。
  3. 运行容器
    • 使用命令 docker run -it --rm {model_image} 启动容器。
    • 根据需要配置映射端口和挂载卷。

硬件与性能要求

  • 硬件配置:根据模型大小和量化方式,硬件需求有所不同。
    • 8B 版本:RTX 3060 8G 显卡、16G 内存。
    • 32B 版本:建议使用 RTX 4090 或更高配置。
  • 性能优化:可参考 DeepSeek 官方文档中的优化选项。

其他工具

  • 可结合 ChatBox 等工具,提升交互体验。
  • 使用 Open WebUI 图形界面查看后台运行情况。

如果需要更详细的信息,可以参考 DeepSeek 官方部署文档。

http://www.dtcms.com/a/62468.html

相关文章:

  • 在 UniApp 开发的网站中使图片能够缓存,不一直刷新
  • 委外订单不能删除提示领料未发量不能小于零
  • 【 PyQt】事件的触发:信号与槽
  • GitHub 项目版本管理与 Release 发布流程记录
  • HTTPS工作原理与安全机制详解(仅供参考)
  • 【RabbitMQ】事务
  • 查看端口被占用命令
  • FX-函数重载、重写(覆盖)、隐藏
  • Rust与Cargo版本关系(Rust版本、rustc、rustup)
  • 信息安全意识之安全组织架构图
  • ubuntu 24.04通过Flatpak安装迅雷
  • Dom详解
  • 02 | 快速部署 fastgo 项目
  • 在 Spring Boot 中实现基于 TraceId 的日志链路追踪
  • vue3-element-admin 前后端本地启动联调
  • IntelliJ IDEA v2024.3.4.1 Windows Java开发工具安装
  • 瑞芯微RK3576(2)-调试过程中遇到的问题
  • 如何用AI制作我们记忆中的乡村夜景
  • 获取URL字段的方法
  • 【反无人机目标检测数据集】空对空视觉检测微型无人机:深度学习的实验评估
  • C语言每日一练——day_4
  • 力扣(leetcode)每日一题 2012 数组美丽值求和
  • Linux 磁盘和文件系统管理
  • SpringMVC 基本概念与代码示例
  • 数据结构之线性表
  • Django-ORM-prefetch_related
  • 排序 --- 快速排序
  • 网络配置与pip工具安装
  • 文件上传漏洞 upload-labs靶场
  • 开源数字人模型Heygem