当前位置: 首页 > news >正文

deepseek本地集群部署调研

deepseek本地集群部署调研

硬件要求

大致显卡需求:运行 7B 机型至少需要 8GB 内存,运行 13B 机型至少需要 16GB 内存,运行 33B 机型至少需要 32GB 内存。

image-20250223162854060

image-20250223164158798

技术

Ollama

项目地址:https://github.com/ollama/ollama

image-20250223162903019

vLLM

项目地址:https://github.com/vllm-project/vllm

openwebui

大模型对话界面

image-20250223163054095

项目地址:https://github.com/open-webui/open-webui

k8s*

文档:https://kubernetes.io/zh-cn/docs/home/

集群部署方案,可选用其他技术

实验室原有配置是否有集群管理

备选方案

部署蒸馏模型

image-20250223165025460

接入第三方api

deepseek官网(被攻击,不稳定)

硅基流动(首次注册有免费额度)

火山引擎(首次注册有免费额度)

腾讯云平台(首次注册有免费额度)

阿里云平台(首次注册有免费额度)

天翼云(首次注册有免费额度)

超算互联网

纳米AI

费额度)

阿里云平台(首次注册有免费额度)

天翼云(首次注册有免费额度)

超算互联网

纳米AI

Azure

相关文章:

  • GCC RISCV 后端 -- cc1 入口
  • 批量插入对比-mysql-oracle-sqlserver
  • Three.js 新前端学习
  • tauri-plugin-shell插件将_blank的a标签用浏览器打开了,,,解决办法
  • android为第三方提供部分系统接口
  • Linux 系统不同分类的操作命令区别
  • Windows系统编程(八)线程同步
  • 【gRPC】Java高性能远程调用之gRPC详解
  • 大语言模型中温度参数(Temperature)的核心原理
  • 大学至今的反思与总结
  • python-leetcode-零钱兑换 II
  • EasyRTC嵌入式视频通话SDK的跨平台适配,构建web浏览器、Linux、ARM、安卓等终端的低延迟音视频通信
  • 内核编程七:Linux 内核日志的级别
  • DeepSeek大模型深度解析:架构、技术与应用全景
  • SAP-ABAP:SAP第二代增强之隐式增强(Implicit Enhancements)和Enhancement Framework 的详细解析
  • 密码学(一)
  • 混合专家模型(MoE):高效处理复杂任务的智能架构,DeepSeek性能出色的秘诀
  • SpringCloud微服务开发工程细节
  • 1.15-16-17-18迭代器与生成器,函数,数据结构,模块
  • LeetCode 718.最长重复子数组(动态规划,Python)
  • 中国古代文学研究专家、南开大学教授李剑国逝世
  • “打铁”热邂逅江南水乡,长三角首个国际级铁三赛事有何不同
  • 西藏普兰县公安局网安大队向自媒体人宣传网络安全知识
  • 以色列在加沙发起新一轮强攻,同步与哈马斯展开无条件谈判
  • 海外市场,押注中国无人驾驶龙头
  • 广西北流出现强降雨,1人被洪水冲走已无生命体征