华为云 Flexus+DeepSeek 实战:华为云Dify 平台 CCE 高可用集群部署与大模型知识库构建指南
华为云 Flexus+DeepSeek 实战:华为云Dify 平台 CCE 高可用集群部署与大模型高质量知识库构建指南
文章目录
- 华为云 Flexus+DeepSeek 实战:华为云Dify 平台 CCE 高可用集群部署与大模型高质量知识库构建指南
- 前言
- 1、ModelArts Studio大模型开通
- 2、Dify平台CCE高可用集群部署
- 2.1 创建rf_admin_trust委托
- 2.2 获取OBS桶名
- 2.3 获取AK、SK密钥
- 2.4 CCE集群高可用部署
- 3、Dify平台模型供应商配置
- 4、高质量知识库配置Embedding及Rerank模型
- 4.1 部署Embedding及Rerank模型
- 4.2 高质量知识库模型供应商配置
- 4.2.1 ECS公网IP获取
- 4.2.2 Ollama模型安装
- 4.2.3 Xorbits Inference模型安装
- 资源删除销毁
- 华为云CCE高可用集群部署Dify平台
- 总结
前言
本文聚焦华为云 Flexus 与 DeepSeek 深度整合场景,为开发者提供从 ModelArts Studio 大模型服务开通、CCE 高可用集群自动化部署 Dify 平台,到 Embedding 与 Rerank 模型部署及高质量知识库构建的全流程实战指南。通过华为云容器服务多节点冗余架构、弹性扩缩容能力与 Dify 微服务架构的结合,详解如何高效构建兼具高可用性、弹性扩展与安全合规的大模型应用开发环境,助力企业快速落地智能问答、知识管理等 AI 场景应用。
1、ModelArts Studio大模型开通
1、领取开通在线推理提供服务,点击ModelArts Studio控制台
2、点击模型推理-在线推理
3、开通商用服务或者免费服务都可以,如果是体验使用可以暂时使用免费服务,等到有更高的需求可以使用商用服务,另外说明商用服务是按Token计费
- 免费服务开通:仅适合用于体验模型,且受严格的速率限制。平台可能会不定时调整其适用模型、免费额度、有效期等内容
- 商用服务:将为您提供商用级别的推理API服务,开放后您可以获取付费API服务
2、Dify平台CCE高可用集群部署
个人建议官方文档搭配博主的流程一起看,因为官方文档有的地方可能不是那么详细
- 创建rf_admin_trust委托和创建OBS桶名:官方文档
- 获取访问密钥AK/SK:官方文档
2.1 创建rf_admin_trust委托
1、统一身份认证-委托-创建委托-创建rf_admin_trust委托
2、创建委托
委托名称:rf_admin_trust
委托类型:云服务
云服务:选择RFS
3、立即授权
4、搜索框中输入"Tenant Administrator"并勾选搜索结果,单击"下一步"
5、选择所有资源,并单击确定完成配置
6、委托列表中出现rf_admin_trust委托则创建成功
7、在云容器引擎CCE控制台,实现授权
cce_admin_trust
和cce_cluster_agency
委托云容器引擎CCE控制台
8、委托确认
2.2 获取OBS桶名
1、创建桶(配置桶名即可,其他默认后续可以修改)-立即创建
2、桶列表显示则表示创建成功
2.3 获取AK、SK密钥
1、我的凭证-访问密钥
2、新增访问密钥
3、下载密钥
4、保存密钥,如下获取到了access_key
5、可以在访问密钥列表中查看访问密钥ID(AK),在下载的.csv文件中查看秘密访问密钥(SK)
2.4 CCE集群高可用部署
1、点击一键部署(CCE容器高可用部署)
2、选择模板(默认配置即可)
创建方式:已有模板
模板来源:URL
模板 URL:系统默认
3、参数配置
配置项名称 说明 注意事项 cce_node_pool_password CCE 集群 node 节点密码,用于集群节点登录 需符合密码格式要求(具体格式需参考平台规范,避免因格式错误导致任务回滚) pgsql_password PostgreSQL 数据库的管理员密码 取值范围需符合数据库密码强度要求(如长度、字符类型等) pgsql_user_password PostgreSQL 数据库的 database 用户密码 同上 redis_password Redis 数据库密码 需满足 Redis 密码复杂度要求 css_password CSS 向量数据库的密码 确保与 CSS 服务密码规则一致 obs_bucket 填写已创建的 OBS 桶名称 需与实际创建的桶名完全一致 access_key 访问密钥 ID(AK) 从华为云账号中获取有效的 AK secret_key 秘密访问密钥(SK),从下载的.csv 文件中查看 需确保 SK 的正确性,避免泄露 ecs_password 部署 Embedding 和 Reranker 模型的云服务器密码 符合云服务器密码策略(如大小写字母、数字、特殊字符组合) 重要注意事项:
- 密码格式检查:所有密码需严格遵循对应服务的格式要求(如长度、字符类型、特殊字符限制等),格式错误会导致任务执行时回滚报错
- 信息准确性:OBS 桶名、AK/SK 等信息需与实际创建的资源完全一致,避免因名称或密钥错误导致认证失败
- 唯一性验证:创建资源栈前,确认名称未被其他资源栈使用,避免命名冲突
4、资源栈设置
IAM权限委托:选择上面已经创建的委托
回滚设置和删除保护:可以根据需要开启,默认是关闭,建议开启回滚设置,如果创建失败华为云会自动删除创建的一些列配置,如果不开启需要手动删除非常麻烦
5、配置确认
确认自己所做的配置有没有问题,如果问题创建执行任务即可,创建执行任务确认即可
6、部署-执行
7、基本信息-状态等待部署完成即可
8、等待部署完成(预计10-20分钟)
9、浏览器地址访问
10、通过浏览器访问链接来访问Dify - LLM 应用开发平台
11、设置的管理员账户信息
12、登录后显示如下页面,代表Dify - LLM 应用开发平台已经部署成功
3、Dify平台模型供应商配置
1、Dify - LLM 应用开发平台模型供应商配置(接入DeepSeek)
2、模型供应商中找到OpenAI-API-compatible并且安装
3、安装成功如下所示
4、DeepSeek模型供应商配置(OpenAI-API-compatible供应商)
5、配置页面
6、API Key获取:ModelArts Studio控制台,点击API KEY管理,创建自己的API KEY,标签和描述根据自己的填即可,获取到自己的API KEY注意保存(只会显示一次自己的API KEY)
7、自定义 API endpoint 地址获取:ModelArts Studio控制台,点击在线推理,选择自己的服务,商用服务或者免费服务的用法相同,点击调用说明获取自定义API endpoint 地址
8、点击OpenAI SDK复制API接口信息,这个就是自己的API endpoint 地址
9、Dify - LLM 应用开发平台填写获取到的API KEY和自定义 API endpoint 地址和模型名称
10、点击保存,页面会显示修改成功,配置成功页面如下
4、高质量知识库配置Embedding及Rerank模型
4.1 部署Embedding及Rerank模型
1、登录华为云解决方案实践,选择快速部署Embedding及Rerank模型
2、点击进入-下滑至方案架构
3、区域选择
成本预算:3~6元(按需计费:Flexus云服务器X实例2.28元/小时,弹性公网IP EIP0.80元/GB,体验本方案预计成本不超过6元)
4、选择模板
- 默认配置下一步
5、参数配置
- 按模板要求对部分资源加密取消勾选
- ecs_password:云服务器密码,长度为8-26位,密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种、
6、资源栈设置
开启回滚设置:开启回滚表示操作失败时,会自动回滚至系统所保存的上一个成功的资源状态。创建后可在资源栈详情页面修改。
7、配置确认
8、创建执行计划
9、部署
10、执行计划
11、基本信息中等待状态改变为部署完成即可完成部署
4.2 高质量知识库模型供应商配置
4.2.1 ECS公网IP获取
1、ECS公网IP获取
4.2.2 Ollama模型安装
1、安装bge-m3(embedding)和bge-reranker-v2-m3 (reranker)模型供应商
- Ollama安装
2、Ollama模型供应商配置
- 模型类型:Text Embedding
- 模型名称:bge-m3
- 基础URL:http://ECS公网IP:11434(如上前提有获取流程)
- 端口号:11434
3、Xorbits Inference模型安装
4.2.3 Xorbits Inference模型安装
1、Xorbits Inference模型配置
模型类型: Rerank
模型名称与模型UID均填写:bge-reranker-v2-m3
服务器URL:http://ECS公网IP:9997
端口号:9997
2、模型成功配置
如上即完成了华为云集群部署以及高质量知识库配置Embedding及Rerank模型的创建和配置,后续即可直接在华为云Dify平台中,直接创建高质量知识库,经济知识库默认配置,不需要特殊创建过程。
资源删除销毁
Tip:
- 删除资源栈的流程官方文档比较详细可以参考官方文档
- 资源删除销毁单机部署和CCE集群高可用部署的方式相同
1、进入资源编排服务控制台,找到刚创建成功的资源栈,单击行操作列的删除,页面弹出确认删除框,在输入框中再次输入Delete,单击确定,即可删除
2、如果启用删除保护的情况下删除资源堆栈,则会显示错误消息
3、只需要将删除保护关闭再删除即可(此处我并未开启所以不做演示)
华为云CCE高可用集群部署Dify平台
基于华为云 CCE 高可用集群部署 Dify 平台,开发者利用 CCE 多节点冗余、自动扩缩容及网络隔离能力,结合 Dify 微服务架构实现组件弹性扩展,通过华为云 RDS/Redis/EVS 保障数据高可用,以简洁架构快速构建安全可靠的应用环境
✅高可用性:华为云 CCE 提供多节点冗余架构,控制平面默认 3 个控制节点,通过 etcd 集群保证数据一致性,单节点故障不影响集群运行。工作节点支持自动扩缩容,能根据负载动态调整数量。同时,Dify 平台的组件如数据库采用华为云 RDS for PostgreSQL 高可用版,缓存使用 ElastiCache for Redis 主从架构,确保关键组件的高可用性,实现服务自愈,减少业务中断时间
✅弹性扩展:CCE 集群支持自动扩缩容,可根据 Dify 平台的业务负载动态调整工作节点数量。Dify 平台本身采用微服务架构,各个组件可独立进行水平扩展,如 Web 服务、API 网关等无状态服务可通过增加副本数量来提升并发处理能力,以应对不同规模的业务流量变化
✅安全可靠:华为云 CCE 通过 VPC 网络隔离、安全组规则以及 Kubernetes NetworkPolicy 实现网络与安全隔离,保护 Dify 组件通信安全。数据方面,采用云硬盘 EVS 持久化存储,支持多副本数据冗余和自动数据备份,RDS 支持数据静态加密和传输加密,确保 Dify 数据的安全性和完整性。同时,华为云 CCE 服务通过多项安全合规认证,满足企业级的安全合规需求
总结
本文完整呈现了在华为云 CCE 高可用集群部署 Dify 平台并构建大模型知识库的实战过程,涵盖从 ModelArts Studio 开通大模型服务、创建委托与 OBS 桶等准备工作,到 CCE 集群参数配置、模型供应商对接及 Embedding 与 Rerank 模型部署的全流程,帮助开发者高效利用华为云资源,以简洁架构实现 Dify 平台的高可用部署与知识库搭建,快速落地大模型应用开发。