当前位置: 首页 > news >正文

华为云 Flexus+DeepSeek 实战:华为云Dify 平台 CCE 高可用集群部署与大模型知识库构建指南

华为云 Flexus+DeepSeek 实战:华为云Dify 平台 CCE 高可用集群部署与大模型高质量知识库构建指南

文章目录

    • 华为云 Flexus+DeepSeek 实战:华为云Dify 平台 CCE 高可用集群部署与大模型高质量知识库构建指南
      • 前言
        • 1、ModelArts Studio大模型开通
        • 2、Dify平台CCE高可用集群部署
          • 2.1 创建rf_admin_trust委托
          • 2.2 获取OBS桶名
          • 2.3 获取AK、SK密钥
          • 2.4 CCE集群高可用部署
        • 3、Dify平台模型供应商配置
        • 4、高质量知识库配置Embedding及Rerank模型
          • 4.1 部署Embedding及Rerank模型
          • 4.2 高质量知识库模型供应商配置
            • 4.2.1 ECS公网IP获取
            • 4.2.2 Ollama模型安装
            • 4.2.3 Xorbits Inference模型安装
      • 资源删除销毁
      • 华为云CCE高可用集群部署Dify平台
      • 总结

前言

本文聚焦华为云 Flexus 与 DeepSeek 深度整合场景,为开发者提供从 ModelArts Studio 大模型服务开通、CCE 高可用集群自动化部署 Dify 平台,到 Embedding 与 Rerank 模型部署及高质量知识库构建的全流程实战指南。通过华为云容器服务多节点冗余架构、弹性扩缩容能力与 Dify 微服务架构的结合,详解如何高效构建兼具高可用性、弹性扩展与安全合规的大模型应用开发环境,助力企业快速落地智能问答、知识管理等 AI 场景应用。

1、ModelArts Studio大模型开通

1、领取开通在线推理提供服务,点击ModelArts Studio控制台

在这里插入图片描述

2、点击模型推理-在线推理

在这里插入图片描述

3、开通商用服务或者免费服务都可以,如果是体验使用可以暂时使用免费服务,等到有更高的需求可以使用商用服务,另外说明商用服务是按Token计费

  • 免费服务开通:仅适合用于体验模型,且受严格的速率限制。平台可能会不定时调整其适用模型、免费额度、有效期等内容

在这里插入图片描述

  • 商用服务:将为您提供商用级别的推理API服务,开放后您可以获取付费API服务

在这里插入图片描述

2、Dify平台CCE高可用集群部署

个人建议官方文档搭配博主的流程一起看,因为官方文档有的地方可能不是那么详细

  • 创建rf_admin_trust委托和创建OBS桶名:官方文档
  • 获取访问密钥AK/SK:官方文档
2.1 创建rf_admin_trust委托

1、统一身份认证-委托-创建委托-创建rf_admin_trust委托

在这里插入图片描述

2、创建委托

  • 委托名称:rf_admin_trust

  • 委托类型:云服务

  • 云服务:选择RFS

在这里插入图片描述

3、立即授权

在这里插入图片描述

4、搜索框中输入"Tenant Administrator"并勾选搜索结果,单击"下一步"

在这里插入图片描述

5、选择所有资源,并单击确定完成配置

在这里插入图片描述

在这里插入图片描述

6、委托列表中出现rf_admin_trust委托则创建成功

在这里插入图片描述

7、在云容器引擎CCE控制台,实现授权cce_admin_trustcce_cluster_agency委托

云容器引擎CCE控制台

在这里插入图片描述

8、委托确认

在这里插入图片描述

2.2 获取OBS桶名

1、创建桶(配置桶名即可,其他默认后续可以修改)-立即创建

在这里插入图片描述

2、桶列表显示则表示创建成功

在这里插入图片描述

2.3 获取AK、SK密钥

1、我的凭证-访问密钥

在这里插入图片描述

2、新增访问密钥

在这里插入图片描述

3、下载密钥

在这里插入图片描述

4、保存密钥,如下获取到了access_key

在这里插入图片描述

5、可以在访问密钥列表中查看访问密钥ID(AK),在下载的.csv文件中查看秘密访问密钥(SK)

在这里插入图片描述

2.4 CCE集群高可用部署

1、点击一键部署(CCE容器高可用部署)

在这里插入图片描述

2、选择模板(默认配置即可)

  • 创建方式:已有模板

  • 模板来源:URL

  • 模板 URL:系统默认

在这里插入图片描述

3、参数配置

配置项名称说明注意事项
cce_node_pool_passwordCCE 集群 node 节点密码,用于集群节点登录需符合密码格式要求(具体格式需参考平台规范,避免因格式错误导致任务回滚)
pgsql_passwordPostgreSQL 数据库的管理员密码取值范围需符合数据库密码强度要求(如长度、字符类型等)
pgsql_user_passwordPostgreSQL 数据库的 database 用户密码同上
redis_passwordRedis 数据库密码需满足 Redis 密码复杂度要求
css_passwordCSS 向量数据库的密码确保与 CSS 服务密码规则一致
obs_bucket填写已创建的 OBS 桶名称需与实际创建的桶名完全一致
access_key访问密钥 ID(AK)从华为云账号中获取有效的 AK
secret_key秘密访问密钥(SK),从下载的.csv 文件中查看需确保 SK 的正确性,避免泄露
ecs_password部署 Embedding 和 Reranker 模型的云服务器密码符合云服务器密码策略(如大小写字母、数字、特殊字符组合)

重要注意事项:

  • 密码格式检查:所有密码需严格遵循对应服务的格式要求(如长度、字符类型、特殊字符限制等),格式错误会导致任务执行时回滚报错
  • 信息准确性:OBS 桶名、AK/SK 等信息需与实际创建的资源完全一致,避免因名称或密钥错误导致认证失败
  • 唯一性验证:创建资源栈前,确认名称未被其他资源栈使用,避免命名冲突

在这里插入图片描述

4、资源栈设置

IAM权限委托:选择上面已经创建的委托

回滚设置和删除保护:可以根据需要开启,默认是关闭,建议开启回滚设置,如果创建失败华为云会自动删除创建的一些列配置,如果不开启需要手动删除非常麻烦

在这里插入图片描述

5、配置确认

确认自己所做的配置有没有问题,如果问题创建执行任务即可,创建执行任务确认即可

在这里插入图片描述

在这里插入图片描述

6、部署-执行

在这里插入图片描述

在这里插入图片描述

7、基本信息-状态等待部署完成即可

在这里插入图片描述

8、等待部署完成(预计10-20分钟)

在这里插入图片描述

在这里插入图片描述

9、浏览器地址访问

在这里插入图片描述

10、通过浏览器访问链接来访问Dify - LLM 应用开发平台

在这里插入图片描述

11、设置的管理员账户信息

在这里插入图片描述

12、登录后显示如下页面,代表Dify - LLM 应用开发平台已经部署成功

在这里插入图片描述

3、Dify平台模型供应商配置

1、Dify - LLM 应用开发平台模型供应商配置(接入DeepSeek)

在这里插入图片描述

2、模型供应商中找到OpenAI-API-compatible并且安装

在这里插入图片描述

3、安装成功如下所示

在这里插入图片描述

4、DeepSeek模型供应商配置(OpenAI-API-compatible供应商)

在这里插入图片描述

5、配置页面

在这里插入图片描述

6、API Key获取:ModelArts Studio控制台,点击API KEY管理,创建自己的API KEY,标签和描述根据自己的填即可,获取到自己的API KEY注意保存(只会显示一次自己的API KEY)

在这里插入图片描述

在这里插入图片描述

7、自定义 API endpoint 地址获取:ModelArts Studio控制台,点击在线推理,选择自己的服务,商用服务或者免费服务的用法相同,点击调用说明获取自定义API endpoint 地址

在这里插入图片描述

8、点击OpenAI SDK复制API接口信息,这个就是自己的API endpoint 地址

在这里插入图片描述

9、Dify - LLM 应用开发平台填写获取到的API KEY和自定义 API endpoint 地址和模型名称

在这里插入图片描述

10、点击保存,页面会显示修改成功,配置成功页面如下

在这里插入图片描述

4、高质量知识库配置Embedding及Rerank模型
4.1 部署Embedding及Rerank模型

1、登录华为云解决方案实践,选择快速部署Embedding及Rerank模型

在这里插入图片描述

2、点击进入-下滑至方案架构

在这里插入图片描述

3、区域选择

成本预算:3~6元(按需计费:Flexus云服务器X实例2.28元/小时,弹性公网IP EIP0.80元/GB,体验本方案预计成本不超过6元)

在这里插入图片描述

4、选择模板

  • 默认配置下一步

在这里插入图片描述

5、参数配置

  • 按模板要求对部分资源加密取消勾选
  • ecs_password:云服务器密码,长度为8-26位,密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种、

在这里插入图片描述

6、资源栈设置

开启回滚设置:开启回滚表示操作失败时,会自动回滚至系统所保存的上一个成功的资源状态。创建后可在资源栈详情页面修改。

在这里插入图片描述

7、配置确认

在这里插入图片描述

8、创建执行计划

在这里插入图片描述

9、部署

在这里插入图片描述

10、执行计划

在这里插入图片描述

11、基本信息中等待状态改变为部署完成即可完成部署

在这里插入图片描述

在这里插入图片描述

4.2 高质量知识库模型供应商配置
4.2.1 ECS公网IP获取

1、ECS公网IP获取

在这里插入图片描述

在这里插入图片描述

4.2.2 Ollama模型安装

1、安装bge-m3(embedding)和bge-reranker-v2-m3 (reranker)模型供应商

  • Ollama安装

在这里插入图片描述

在这里插入图片描述

2、Ollama模型供应商配置

在这里插入图片描述

  • 模型类型:Text Embedding
  • 模型名称:bge-m3
  • 基础URL:http://ECS公网IP:11434(如上前提有获取流程)
  • 端口号:11434

在这里插入图片描述

3、Xorbits Inference模型安装

在这里插入图片描述

在这里插入图片描述

4.2.3 Xorbits Inference模型安装

1、Xorbits Inference模型配置

模型类型: Rerank

模型名称与模型UID均填写:bge-reranker-v2-m3

服务器URL:http://ECS公网IP:9997

端口号:9997

在这里插入图片描述

在这里插入图片描述

2、模型成功配置

在这里插入图片描述
如上即完成了华为云集群部署以及高质量知识库配置Embedding及Rerank模型的创建和配置,后续即可直接在华为云Dify平台中,直接创建高质量知识库,经济知识库默认配置,不需要特殊创建过程。

资源删除销毁

Tip:

  • 删除资源栈的流程官方文档比较详细可以参考官方文档
  • 资源删除销毁单机部署和CCE集群高可用部署的方式相同

1、进入资源编排服务控制台,找到刚创建成功的资源栈,单击行操作列的删除,页面弹出确认删除框,在输入框中再次输入Delete,单击确定,即可删除

在这里插入图片描述

2、如果启用删除保护的情况下删除资源堆栈,则会显示错误消息

在这里插入图片描述

3、只需要将删除保护关闭再删除即可(此处我并未开启所以不做演示)

在这里插入图片描述

华为云CCE高可用集群部署Dify平台

基于华为云 CCE 高可用集群部署 Dify 平台,开发者利用 CCE 多节点冗余、自动扩缩容及网络隔离能力,结合 Dify 微服务架构实现组件弹性扩展,通过华为云 RDS/Redis/EVS 保障数据高可用,以简洁架构快速构建安全可靠的应用环境

高可用性:华为云 CCE 提供多节点冗余架构,控制平面默认 3 个控制节点,通过 etcd 集群保证数据一致性,单节点故障不影响集群运行。工作节点支持自动扩缩容,能根据负载动态调整数量。同时,Dify 平台的组件如数据库采用华为云 RDS for PostgreSQL 高可用版,缓存使用 ElastiCache for Redis 主从架构,确保关键组件的高可用性,实现服务自愈,减少业务中断时间

弹性扩展:CCE 集群支持自动扩缩容,可根据 Dify 平台的业务负载动态调整工作节点数量。Dify 平台本身采用微服务架构,各个组件可独立进行水平扩展,如 Web 服务、API 网关等无状态服务可通过增加副本数量来提升并发处理能力,以应对不同规模的业务流量变化

安全可靠:华为云 CCE 通过 VPC 网络隔离、安全组规则以及 Kubernetes NetworkPolicy 实现网络与安全隔离,保护 Dify 组件通信安全。数据方面,采用云硬盘 EVS 持久化存储,支持多副本数据冗余和自动数据备份,RDS 支持数据静态加密和传输加密,确保 Dify 数据的安全性和完整性。同时,华为云 CCE 服务通过多项安全合规认证,满足企业级的安全合规需求

总结

本文完整呈现了在华为云 CCE 高可用集群部署 Dify 平台并构建大模型知识库的实战过程,涵盖从 ModelArts Studio 开通大模型服务、创建委托与 OBS 桶等准备工作,到 CCE 集群参数配置、模型供应商对接及 Embedding 与 Rerank 模型部署的全流程,帮助开发者高效利用华为云资源,以简洁架构实现 Dify 平台的高可用部署与知识库搭建,快速落地大模型应用开发。

相关文章:

  • C++链表的虚拟头节点
  • 【unity游戏开发——热更新】YooAsset简化资源加载、打包、更新等流程
  • 【设计模式】6.原型模式
  • 获取 Git 仓库
  • 第三章 线性回归与感知机
  • 面试题-ts中的typeof
  • ACL 2025 Findings | 无监督概念发掘,提高文本解释的可理解性
  • 如何排查在docker中运行软件的故障:Docker故障排查可视化指南,三招锁定问题根源
  • 从0到1学Linux:Linux进程
  • BGP路由反射器(RR)实验详解,结尾有详细脚本
  • 【软考高级系统架构论文】论湖仓一体架构及其应用
  • ELB的设置
  • React 重识
  • Taro 跨端应用性能优化全攻略:从原理到实践
  • 基于强化学习的5G通信网络基站资源动态分配策略matlab性能仿真
  • 【软考高级系统架构论文】论面向服务架构设计及其应用
  • 【科研绘图系列】R语言绘制circos图形(circos plot)
  • 1. 常见K线组合
  • CertiK联创顾荣辉将于港大活动发表演讲,分享Web3安全与发展新视角
  • 【自动鼠标键盘控制器|支持图像识别】
  • 住房和城乡建设部叉车证能用吗/成都seo技术
  • wordpress百度小程序/北京seo关键词排名
  • 响应式环保网站模板下载/培训机构优化
  • 速度最快的wordpress主题/百度搜索优化软件
  • 小网站怎么赚钱/企业营销策划方案
  • 网站建设几个要素/建网站公司