当前位置: 首页 > news >正文

DeepSeek集群版一键部署

DeepSeek集群版一键部署

简介: 本文介绍如何通过阿里云计算巢一键部署DeepSeek集群版,支持弹性扩缩容。DeepSeek-R1是2025年发布的开源大模型,性能与OpenAI-o1相当。集成Ollama和Open WebUI,用户可通过Web界面管理大模型。计算巢基于阿里云ACK和Knative架构,存储采用NAS,网关使用Kourier,默认拉取deepseek-r1:7B模型。计费涉及GPU规格、节点数量、磁盘容量和公网带宽。RAM账号需具备ECS、VPC等权限。部署流程简单,用户可快速启动并使用服务,支持公网和私网访问,提供API接口及进阶教程,如添加用户、下载其他模型和配置弹性扩缩容。

本文介绍如何通过计算巢一键部署DeepSeek集群版

整体架构

DeepSeek-R1简介

DeepSeek-R1是深度求索(DeepSeek)于2025年1月20日发布的开源人工智能大型语言模型。在数学、代码及推理任务上的表现与 OpenAI-o1 旗鼓相当。 DeepSeek-R1(7b)是 DeepSeek R1 的中端版本。其设计目标是将 DeepSeek R1 的强大推理能力转移到更小的模型中,以提高计算效率和部署灵活性。

Open WebUI和Ollama简介

Open WebUI 是一个功能丰富且用户友好的自托管 Web 用户界面(WebUI),它被设计用于与大型语言模型(LLMs)进行交互,特别是那些由 Ollama 或与 OpenAI API 兼容的服务所支持的模型。

Ollama 是一个开源项目,其主要目标是简化大型语言模型(LLMs)的部署和运行流程,使得用户能够在本地机器或私有服务器上轻松运行这些模型。

Open WebUI和Ollama做了集成,可以轻松在web界面上管理大模型,本服务通过Ollama运行DeepSeek-R1模型,您可以在Open WebUI中直接选择DeepSeek-R1模型进行对话。

集群版部署说明

通过阿里云计算巢服务,可以一键部署DeepSeek ACK集群版并支持弹性扩缩容,也可以部署单机版Ollama+OpenWebUI DeepSeek服务,关于阿里云计算巢可以查看计算巢帮助文档。
本服务基于阿里云ACK,利用Knative开源架构,实现对Ollama与OpenWebUI的部署,其中存储采用了NAS,Knative网关采用Kourier,服务默认会拉取deepseek-r1:7B模型。
Knative是一款基于Kubernetes集群的开源Serverless框架,负责管理Serverless工作负载,提供了应用部署、多版本管理等能力,且支持强大灵活的扩缩容能力。详情请参考:Knative文档。

计费说明

DeepSeek集群版在阿里云上的费用主要涉及:

  • 所选GPU云服务器的规格
  • 节点数量
  • 磁盘容量
  • 公网带宽
    计费方式:按量付费(小时)或包年包月
    预估费用在创建实例时可实时看到。

RAM账号所需权限

部署Deepseek集群版服务实例,需要对部分阿里云资源进行访问和创建操作。因此您的账号需要包含如下资源的权限。

部署流程

  1. 单击商品链接,点击立即订阅部署。
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传进入服务实例部署界面,选择模板:ollama_knative集群版,然后根据界面提示填写参数,可以看到对应询价明细,确认参数后点击下一步:确认订单。(计算巢也支持单机版部署Ollama+OpenWebUI的DeepSeek服务)。
    注意:如果要使用70B的模型,推荐选用64GB以上显存的规格。如果使用671B的模型,只能选择H20的机器。

  2. 点击下一步:确认订单后可以也看到价格预览,随后点击立即部署,等待部署完成。
  3. 等待部署完成后就可以开始使用服务,进入服务实例详情点击OpenWebUIServer访问。

使用说明

公网OpenWebUI地址

  1. 访问概览页的公网OpenWebUI地址,注册管理员账号并登录。
  2. 登录成功后即可使用默认的deepseek-r1:7b模型进行对话。本服务内置了截图所示的几种参数规模的模型,默认使用7B模型,可以选择下面其他参数规模的模型。请根据购买的ECS规格显存大小进行选择,模型参数规模越大需要的显存越高,启动加载、推理会更慢,推理结果越精确智能。
    如果出现选择模型的地方为空,则表示内置模型还在拉取中,可以等待几分钟,或者查看容器日志,可以看到模型拉取进度。

私网API地址

  1. 在和服务器同一VPC内的ECS中访问概览页的私网API地址。访问示例如下:
curl -H "Host: ollama.ollama.svc.cluster.local" http://${PrivateIp}/api/generate -d  '{
  "model": "deepseek-r1:7b",
  "prompt": "你是谁?"
}'

如果提示模型还未下载好则可以等待几分钟重试即可。

  1. 如果想通过公网访问API地址,需要在Kourier页面关闭仅内网访问,便能通过公网访问API地址。关闭方式:
curl -H "Host: ollama.ollama.example.com" http://${GatewayIp}/api/generate -d  '{
  "model": "deepseek-r1:7b",
  "prompt": "你是谁?"
}'
  1. 进入集群管理页面,点击左侧导航栏的应用,点击Knative,进入Knative页面。
  2. 点击服务管理,选择ollama命名空间,然后可以看到ollama服务。
  3. 点击详情,取消勾选仅内部访问,然后点击确定
  4. 默认域名自动修改为 ollama.ollama.example.com。随后通过示例进行访问。其中GatewayIp采用页面基本信息中的访问网关中的ip。


    访问示例如下:

进阶教程

  • 在管理员面板中添加其他用户

  • 通过面板下载其他模型,支持的模型请查看ollama官网:https://ollama.ai/library

  • 配置弹性扩缩容 Knativa提供灵活的弹性扩缩容功能,您可以参考该文档设置对应的扩缩容配置:基于流量请求数实现服务自动扩缩容,
    需要注意,目前每个pod分配了一张GPU,当通过扩容得到的pod数量超过GPU数量时将会导致其余pod扩容失败。可以创建一个弹性gpu节点池,当新创建的pod 所需要gpu资源不够,处于pending的时候,通过gpu节点池弹出来新的节点供pod使用, 具体参考文档:启用节点自动伸缩。

相关实践学习

2048小游戏

基于计算巢&ECS云服务器快速部署,带您畅玩2048小游戏。

相关文章

|

17小时前

|

弹性计算 Serverless API

如何在阿里云一键部署FlowiseAI

FlowiseAI 是一款开源低代码开发工具,专为构建定制化的语言学习模型(LLM)应用设计。用户可通过拖放界面轻松创建和管理AI驱动的应用,如聊天机器人和数据分析工具。它基于LangChain框架,支持多种AI模型和数据库集成,实现高度定制化的流程自动化。在阿里云上,可以通过一键部署链接快速部署FlowiseAI,并通过简单的几步配置开始使用。详细操作步骤包括创建ECS实例、获取登录信息等。更多细节可见FlowiseAI官网。

在阿里云上部署ERPNext

ERPNext是一款开源ERP软件,由Rushabh Mehta于2010年创建,它包含了会计、库存、制造、CRM、销售、采购、项目管理,及人事管理等多个功能模块。本文主要介绍如何在阿里云上部署ERPNext。

K3s部署

使用k3s部署python flask项目

K3s部署

相关文章:

  • PyQt 界面编程:QDialog、QWidget、QMainWindow 的面向过程与面向对象编程
  • 在Vue项目中使用three.js在前端页面展示PLY文件或STL文件
  • Python爬虫TLS
  • 玩转SpringCloud Stream
  • 【从0做项目】Java搜索引擎(7) web模块
  • 在做题中学习(90):螺旋矩阵II
  • ArcEngine开发中,当点击窗体中的ButtoncClick时,程序需等待五六秒才反应过来,的解决方案。
  • 深入理解 SQL 事务隔离级别:脏读、不可重复读和幻读
  • 技术速递|Copilot Edits(预览版)介绍
  • 春风席卷法(单词分泌物):一天记20个忘10个任务之3
  • Deepseek搭建本地知识库
  • sql注入漏洞
  • 已解决IDEA无法输入中文问题(亲测有效)
  • Educational Codeforces Round 174 (Rated for Div. 2)(ABCD)
  • 容器网络(三)- calico网络IPIP模式
  • 深浅拷贝区别,怎么区别使用
  • 最新扣子(Coze)案例教程:全自动DeepSeek 写影评+批量生成 + 发布飞书,提效10 倍!手把手教学,完全免费教程
  • Open WebUI项目源码学习记录(从0开始基于纯CPU环境部署一个网页Chat服务)
  • 解决 ssh connect to host github.com port 22 Connection timed out
  • 重看Spring聚焦BeanDefinition分析和构造
  • 中医的千年传承:网络科学描绘其演化之路|PNAS速递
  • 《新时代的中国国家安全》白皮书(全文)
  • 被流量绑架人生,《人生开门红》能戳破网络时代的幻象吗
  • 科学家用AI寻找外星生命
  • 中美经贸高层会谈在瑞士日内瓦举行
  • 著名学者黄修己去世,享年90岁