当前位置：首页 > news >正文

华为云 Flexus+DeepSeek 实战：华为云单机部署 Dify-LLM 开发平台全流程指南【服务部署、模型配置、知识库构建全流程】

news 2025/10/8 19:32:39

华为云 Flexus+DeepSeek 实战：华为云单机部署 Dify-LLM 开发平台全流程指南【服务部署、模型配置、知识库构建全流程】

文章目录

- 华为云 Flexus+DeepSeek 实战：华为云单机部署 Dify-LLM 开发平台全流程指南【服务部署、模型配置、知识库构建全流程】
- - 前言
  - - 1、ModelArts Studio大模型开通
    - 2、Dify平台单机部署
    - 3、Dify平台模型供应商配置
    - 3、Dify平台模型供应商配置
    - 4、高质量知识库配置Embedding及Rerank模型
    - - 4.1 部署Embedding及Rerank模型
      - 4.2 高质量知识库模型供应商配置
      - 4.2.1 ECS公网IP获取
        4.2.2 Ollama模型安装
        4.2.3 Xorbits Inference模型安装
  - 资源删除销毁
  - 华为云单机部署Dify平台
  - 总结

前言

本文通过华为云结合 Flexus 云服务器与 DeepSeek 大模型，为开发者提供了高效便捷的 Dify-LLM 开发平台单机部署方案，将从 ModelArts Studio 服务开通、Dify 平台自动化部署、DeepSeek 模型接入到高质量知识库的 Embedding 及 Rerank 模型配置，全流程详解如何快速构建可落地的 LLM 应用开发环境，助力个人开发者与团队低成本完成原型验证与场景化功能探索

1、ModelArts Studio大模型开通

1、领取开通在线推理提供服务，点击ModelArts Studio控制台

2、点击模型推理-在线推理

3、开通商用服务或者免费服务都可以，如果是体验使用可以暂时使用免费服务，等到有更高的需求可以使用商用服务，另外说明商用服务是按Token计费

免费服务开通：仅适合用于体验模型，且受严格的速率限制。平台可能会不定时调整其适用模型、免费额度、有效期等内容

商用服务：将为您提供商用级别的推理API服务，开放后您可以获取付费API服务

2、Dify平台单机部署

1、部署Dify-LLM应用开发平台

部署方案云服务器单机部署 CCE 容器高可用部署
适用场景规模较小、对复杂性要求低的场景，满足基本公网访问和安全防护需求对应用可靠性、扩展性和性能有较高要求的大型场景
核心资源 1 台华为云 Flexus 云服务器 X 实例、1 个弹性公网 IP、1 个安全组多个弹性公网 IP、弹性负载均衡 ELB、NAT 网关、多台 FlexusX 实例、云容器引擎 CCE Turbo 集群、对象存储服务 OBS、分布式缓存服务 Redis、云数据库 RDS for PostgreSQL 实例、云搜索服务 CSS OpenSearch 集群、4 个安全组
架构特点简单直接，单机部署高可用、可扩展，通过多组件协同构建功能全面的架构
关键能力基础公网访问、基础安全防护负载均衡、高可用保障、分布式存储与缓存、数据库服务、搜索服务、多实例协同扩展
复杂性低高
资源规模单一实例 + 基础网络资源多类型、多实例、多服务组合的资源集群
可靠性保障依赖单实例稳定性通过集群架构、负载均衡和多实例部署实现高可用性，降低单点故障风险
扩展性扩展性有限，需通过单机升级实现资源扩容支持按需横向扩展实例数量，通过容器集群灵活调整资源规模，满足业务增长需求

2、选择模板：使用一键部署云服务器单机部署，如下页面默认配置，直接下一步

3、参数配置：按模板要求对部分资源加密的勾选取消（默认是勾选，如果不取消下一步的时候可能会报错），配置dify_version默认是最新版本更改到0.15.2版本，配置ecs_password（云服务器密码，长度为8-26位，密码至少包含大写字母、小写字母、数字和特殊字符（!@$%^-_=+[{}]:,./?）中的三种。管理员账户默认root）

4、资源栈设置：开启回滚设置（开启回滚表示操作失败时，会自动回滚至系统所保存的上一个成功的资源状态。创建后可在资源栈详情页面修改），删除保护可以根据需求开启（防止资源栈被意外删除。创建后可在资源栈详情页面修改）

5、配置确认，直接点击创建执行计划

6、部署-执行

7、点击事件观察部署情况，看是否有报错，如果没有等到部署完成即可（预计10分钟左右，这个过程中代表华为云正在创建 1 台华为云 Flexus 云服务器 X 实例，搭配 1 个弹性公网 IP 和 1 个安全组，创建完成后就可以通过浏览器链接直接访问Dify - LLM 应用开发平台）

8、基本信息页面查看，是否部署成功，显示部署成功即可点击输出，复制浏览器访问链接来访问Dify - LLM 应用开发平台

9、通过浏览器访问链接来访问Dify - LLM 应用开发平台，设置管理员账户Dify - LLM 应用开发平台

10、通过设置的管理员账户信息来登录

11、登录后显示如下页面，代表Dify - LLM 应用开发平台已经部署成功

部署方案	云服务器单机部署	CCE 容器高可用部署
适用场景	规模较小、对复杂性要求低的场景，满足基本公网访问和安全防护需求	对应用可靠性、扩展性和性能有较高要求的大型场景
核心资源	1 台华为云 Flexus 云服务器 X 实例、1 个弹性公网 IP、1 个安全组	多个弹性公网 IP、弹性负载均衡 ELB、NAT 网关、多台 FlexusX 实例、云容器引擎 CCE Turbo 集群、对象存储服务 OBS、分布式缓存服务 Redis、云数据库 RDS for PostgreSQL 实例、云搜索服务 CSS OpenSearch 集群、4 个安全组
架构特点	简单直接，单机部署	高可用、可扩展，通过多组件协同构建功能全面的架构
关键能力	基础公网访问、基础安全防护	负载均衡、高可用保障、分布式存储与缓存、数据库服务、搜索服务、多实例协同扩展
复杂性	低	高
资源规模	单一实例 + 基础网络资源	多类型、多实例、多服务组合的资源集群
可靠性保障	依赖单实例稳定性	通过集群架构、负载均衡和多实例部署实现高可用性，降低单点故障风险
扩展性	扩展性有限，需通过单机升级实现资源扩容	支持按需横向扩展实例数量，通过容器集群灵活调整资源规模，满足业务增长需求

3、Dify平台模型供应商配置

1、Dify - LLM 应用开发平台模型供应商配置（接入DeepSeek）

2、模型供应商中找到OpenAI-API-compatible并且安装

3、安装成功如下所示

4、DeepSeek模型供应商配置（OpenAI-API-compatible供应商）

5、配置页面

6、API Key获取：ModelArts Studio控制台，点击API KEY管理，创建自己的API KEY，标签和描述根据自己的填即可，获取到自己的API KEY注意保存（只会显示一次自己的API KEY）

7、自定义 API endpoint 地址获取：ModelArts Studio控制台，点击在线推理，选择自己的服务，商用服务或者免费服务的用法相同，点击调用说明获取自定义API endpoint 地址

8、点击OpenAI SDK复制API接口信息，这个就是自己的API endpoint 地址

9、Dify - LLM 应用开发平台填写获取到的API KEY和自定义 API endpoint 地址和模型名称

10、点击保存，页面会显示修改成功，配置成功页面如下

3、Dify平台模型供应商配置

1、Dify - LLM 应用开发平台模型供应商配置（接入DeepSeek）

2、模型供应商中找到OpenAI-API-compatible并且安装

3、安装成功如下所示

4、DeepSeek模型供应商配置（OpenAI-API-compatible供应商）

5、配置页面

6、API Key获取：ModelArts Studio控制台，点击API KEY管理，创建自己的API KEY，标签和描述根据自己的填即可，获取到自己的API KEY注意保存（只会显示一次自己的API KEY）

7、自定义 API endpoint 地址获取：ModelArts Studio控制台，点击在线推理，选择自己的服务，商用服务或者免费服务的用法相同，点击调用说明获取自定义API endpoint 地址

8、点击OpenAI SDK复制API接口信息，这个就是自己的API endpoint 地址

9、Dify - LLM 应用开发平台填写获取到的API KEY和自定义 API endpoint 地址和模型名称

10、点击保存，页面会显示修改成功，配置成功页面如下

4、高质量知识库配置Embedding及Rerank模型

4.1 部署Embedding及Rerank模型

1、登录华为云解决方案实践，选择快速部署Embedding及Rerank模型

2、点击进入-下滑至方案架构

3、区域选择

成本预算：3~6元（按需计费：Flexus云服务器X实例2.28元/小时，弹性公网IP EIP0.80元/GB，体验本方案预计成本不超过6元）

4、选择模板

默认配置下一步

5、参数配置

按模板要求对部分资源加密取消勾选
ecs_password：云服务器密码，长度为8-26位，密码至少必须包含大写字母、小写字母、数字和特殊字符（!@$%^-_=+[{}]:,./?）中的三种、

6、资源栈设置

开启回滚设置：开启回滚表示操作失败时，会自动回滚至系统所保存的上一个成功的资源状态。创建后可在资源栈详情页面修改。

7、配置确认

8、创建执行计划

9、部署

10、执行计划

11、基本信息中等待状态改变为部署完成即可完成部署

4.2 高质量知识库模型供应商配置

4.2.1 ECS公网IP获取

1、ECS公网IP获取

4.2.2 Ollama模型安装

1、安装bge-m3（embedding）和bge-reranker-v2-m3 （reranker）模型供应商

Ollama安装

2、Ollama模型供应商配置

模型类型：Text Embedding
模型名称：bge-m3
基础URL：http://ECS公网IP:11434（如上前提有获取流程）
端口号：11434

3、Xorbits Inference模型安装

4.2.3 Xorbits Inference模型安装

4、Xorbits Inference模型配置

模型类型： Rerank

模型名称与模型UID均填写：bge-reranker-v2-m3

服务器URL：http://ECS公网IP:9997

端口号：9997

5、模型成功配置

如上即完成了华为云单机部署以及高质量知识库配置Embedding及Rerank模型的创建和配置，后续即可直接在华为云Dify平台中，直接创建高质量知识库，经济知识库默认配置，不需要特殊创建过程。

资源删除销毁

Tip：

删除资源栈的流程官方文档比较详细可以参考官方文档
资源删除销毁单机部署和CCE集群高可用部署的方式相同

1、进入资源编排服务控制台，找到刚创建成功的资源栈，单击行操作列的删除，页面弹出确认删除框，在输入框中再次输入Delete，单击确定，即可删除

2、如果启用删除保护的情况下删除资源堆栈，则会显示错误消息

3、只需要将删除保护关闭再删除即可（此处我并未开启所以不做演示）

华为云单机部署Dify平台

华为云单机部署 Dify 平台，15 分钟即可自动化完成相关依赖配置，便捷高效。借助 Flexus X 实例，具备高性能架构与场景化加速能力，成本上有柔性算力革新，还提供旗舰级可靠性保障，适合个人开发者或团队快速体验 Dify 基础功能，进行小规模试验与原型验证

✅部署便捷：利用华为云一键部署功能，15 分钟可自动化完成 VPC、OBS 等依赖配置，较手动部署效率提升 90%。无需复杂的多实例或高可用架构配置，适合个人开发者或团队快速体验基本功能，10 分钟内即可启动，便于模型调试、小规模应用验证

✅性能卓越：以华为云 Flexus X 实例为算力底座，基于擎天架构，单核性能较传统 x86 实例优化 60%，整体算力达业界 1.6 倍。借助 X - Turbo 引擎，PostgreSQL 查询 TPS 达 1200，是传统实例 6 倍，Redis 延迟 < 10ms，向量检索速度提升至 5000 条 / 秒，模型推理吞吐量增加 35%，支持单实例 15 路并发查询

✅安全可靠：依托华为云跨可用区（AZ）容灾机制，45 秒内可完成故障迁移，可用性达 99.995%。通过 OBS AES - 256 加密、SSL/TLS 链路保护满足等保 2.0 合规，以刚性 SLA 承诺，未达标最高获 300% 资源券赔偿

总结

本指南完整覆盖华为云单机部署 Dify-LLM 开发平台的全流程，通过 Flexus 云服务器 X 实例的一键自动化部署，15 分钟即可完成从环境搭建到模型配置的全链路操作，单核性能较传统架构提升 60% 的同时，成本低至 0.95 元 / 小时。结合 DeepSeek 模型接入与 bge 系列 Embedding、Rerank 模型的高效配置，不仅实现向量检索速度 5000 条 / 秒、PostgreSQL 查询 TPS 达 1200 的高性能表现，更通过跨可用区容灾、AES-256 加密等机制保障系统可靠性。该方案尤其适合中小团队快速验证 LLM 应用原型，且支持平滑扩展至 CCE 集群，为规模化部署奠定基础。

查看全文

http://www.dtcms.com/a/256083.html