当前位置: 首页 > news >正文

Deepseek r1 本地部署

1.环境需求:

1. 独显
  
2. 最好32g+内存
  
3. 安装 ollama
  
 https://ollama.com/download/windows
  

2. 安装 deepseek-r1
  

https://ollama.com/library/deepseek-r1

根据显存选择对应大小的模型,推荐能将整个模型放入显存的大小,放不下的话会将一部分放到内存中,生成速度会变慢,最佳效果是显存>模型大小*2;

如选择 7b 模型,则 cmd 输入ollama run deepseek-r1,下载速度比较慢的话可以使用 Ctrl+C 断联在重新下载,会自动继续。

3.  安装 cuda(非必须)

安装 cuda 能加速字符的生成。

https://developer.nvidia.com/cuda-toolkit

4. 安装 open-webui(非必须,需要有python环境)

图形界面,自动读取 ollama 中的模型,便于使用。 // 安装pip install open-webui// 启动open-webui serve

5. 开始使用

访问 http://localhost:8080/,选择对应模型,开始使用。

Ps. 我的电脑配置是 i5-12450k + 4050 8g

* Deepseek-r1 14b 模型加载时间在30-60s,每秒钟2-3个中文字符的生成速度,时间上基本是不可用状态;
  
* Deepseek-r1 7b 模型加载时间在5s左右,每秒钟10-20个中文字符的生成速度,已经赶上了在线模型的速度;
  
* 在一些通用问题上,7b和14b的模型效果没有明显的区别。

http://www.dtcms.com/a/80794.html

相关文章:

  • Laravel框架下通过DB获取数据并转为数组的方法
  • 基于 easyExcel 3.1.5依赖的包 实现动态表头 动态表格内容
  • 初识R语言饼状图
  • MATLAB 调用arduino uno
  • Huawei 鲲鹏(ARM/Aarch64)服务器安装KVM虚拟机(非桌面视图)
  • 鸿蒙路由 HMRouter 配置及使用 二
  • Postgresql无法连接问题汇总
  • Python直方图:从核密度估计到高维空间解析
  • 解决项目使用eslint+prettier,启动报错: error Delete `␍` prettier/prettier
  • Vulnhub-wordpress通关攻略
  • CentOS系类普通挂载磁盘挂载命令
  • 云上 Redis 迁移至本地机房
  • Kafka consumer_offsets 主题深度剖析
  • LabVIEW运动控制(二):EtherCAT运动控制器的多轴示教加工应用(下)
  • npm 命令使用文档
  • 如何在PDF中嵌入数据
  • Excel处理控件Spire.XLS系列教程:C# 在 Excel 中添加或删除单元格边框
  • 【RabbitMQ】RabbitMQ如何保证消息不丢失?
  • sqlite3
  • Linux 音频驱动 WM8960 音频 DAC IC 音乐播放与录音
  • 第四周日志-用网络请求理解bp(2)
  • 华为OD机试-会议室占用时间段(Java 2024 C卷 100分)
  • Rust语言学习
  • 体育直播视频源格式解析:M3U8 vs FLV
  • mysql中find_in_set()函数用法详解及增强函数
  • mysql-DELETE、DROP 和 TRUNCATE区别
  • deepSpeed多机多卡训练服务器之间,和服务器内两个GPU是怎么通信
  • Linux 系统性能优化高级全流程指南
  • 免费开源的NAS解决方案:TrueNAS
  • 工厂方法模式、简单工厂模式与抽象工厂模式的对比