当前位置: 首页 > news >正文

deepseek本地集群部署调研

deepseek本地集群部署调研

硬件要求

大致显卡需求:运行 7B 机型至少需要 8GB 内存,运行 13B 机型至少需要 16GB 内存,运行 33B 机型至少需要 32GB 内存。

image-20250223162854060

image-20250223164158798

技术

Ollama

项目地址:https://github.com/ollama/ollama

image-20250223162903019

vLLM

项目地址:https://github.com/vllm-project/vllm

openwebui

大模型对话界面

image-20250223163054095

项目地址:https://github.com/open-webui/open-webui

k8s*

文档:https://kubernetes.io/zh-cn/docs/home/

集群部署方案,可选用其他技术

实验室原有配置是否有集群管理

备选方案

部署蒸馏模型

image-20250223165025460

接入第三方api

deepseek官网(被攻击,不稳定)

硅基流动(首次注册有免费额度)

火山引擎(首次注册有免费额度)

腾讯云平台(首次注册有免费额度)

阿里云平台(首次注册有免费额度)

天翼云(首次注册有免费额度)

超算互联网

纳米AI

费额度)

阿里云平台(首次注册有免费额度)

天翼云(首次注册有免费额度)

超算互联网

纳米AI

Azure

http://www.dtcms.com/a/51625.html

相关文章:

  • GCC RISCV 后端 -- cc1 入口
  • 批量插入对比-mysql-oracle-sqlserver
  • Three.js 新前端学习
  • tauri-plugin-shell插件将_blank的a标签用浏览器打开了,,,解决办法
  • android为第三方提供部分系统接口
  • Linux 系统不同分类的操作命令区别
  • Windows系统编程(八)线程同步
  • 【gRPC】Java高性能远程调用之gRPC详解
  • 大语言模型中温度参数(Temperature)的核心原理
  • 大学至今的反思与总结
  • python-leetcode-零钱兑换 II
  • EasyRTC嵌入式视频通话SDK的跨平台适配,构建web浏览器、Linux、ARM、安卓等终端的低延迟音视频通信
  • 内核编程七:Linux 内核日志的级别
  • DeepSeek大模型深度解析:架构、技术与应用全景
  • SAP-ABAP:SAP第二代增强之隐式增强(Implicit Enhancements)和Enhancement Framework 的详细解析
  • 密码学(一)
  • 混合专家模型(MoE):高效处理复杂任务的智能架构,DeepSeek性能出色的秘诀
  • SpringCloud微服务开发工程细节
  • 1.15-16-17-18迭代器与生成器,函数,数据结构,模块
  • LeetCode 718.最长重复子数组(动态规划,Python)
  • DeepSeek学术写作全流程提示词
  • LLM自动金融量化-CFGPT
  • 肠胃镜过程描述(普通、无痛)
  • 学习记录-缺陷
  • 如何用FFmpeg高效拉流(避坑指南)
  • 数据库原理4
  • 为AI聊天工具添加一个知识系统 之135 详细设计之76 通用编程语言 之6
  • java项目之基于ssm的在线视频网站开发(源码+文档)
  • java8中young gc的垃圾回收器选型,您了解嘛
  • 基于SpringBoot+mybatis+layui就业管理系统设计和实现