当前位置: 首页 > wzjs >正文

假发外贸网站模板做淘宝客必须要有网站吗

假发外贸网站模板,做淘宝客必须要有网站吗,平阳网站建设公司,电子邮箱怎么注册华为云 FlexusDeepSeek 实战:华为云单机部署 Dify-LLM 开发平台全流程指南【服务部署、模型配置、知识库构建全流程】 文章目录 华为云 FlexusDeepSeek 实战:华为云单机部署 Dify-LLM 开发平台全流程指南【服务部署、模型配置、知识库构建全流程】前言1、…

华为云 Flexus+DeepSeek 实战:华为云单机部署 Dify-LLM 开发平台全流程指南【服务部署、模型配置、知识库构建全流程】

文章目录

    • 华为云 Flexus+DeepSeek 实战:华为云单机部署 Dify-LLM 开发平台全流程指南【服务部署、模型配置、知识库构建全流程】
      • 前言
        • 1、ModelArts Studio大模型开通
        • 2、Dify平台单机部署
        • 3、Dify平台模型供应商配置
        • 3、Dify平台模型供应商配置
        • 4、高质量知识库配置Embedding及Rerank模型
          • 4.1 部署Embedding及Rerank模型
          • 4.2 高质量知识库模型供应商配置
            • 4.2.1 ECS公网IP获取
            • 4.2.2 Ollama模型安装
            • 4.2.3 Xorbits Inference模型安装
      • 资源删除销毁
      • 华为云单机部署Dify平台
      • 总结

前言

本文通过华为云结合 Flexus 云服务器与 DeepSeek 大模型,为开发者提供了高效便捷的 Dify-LLM 开发平台单机部署方案,将从 ModelArts Studio 服务开通、Dify 平台自动化部署、DeepSeek 模型接入到高质量知识库的 Embedding 及 Rerank 模型配置,全流程详解如何快速构建可落地的 LLM 应用开发环境,助力个人开发者与团队低成本完成原型验证与场景化功能探索

1、ModelArts Studio大模型开通

1、领取开通在线推理提供服务,点击ModelArts Studio控制台

在这里插入图片描述

2、点击模型推理-在线推理

在这里插入图片描述

3、开通商用服务或者免费服务都可以,如果是体验使用可以暂时使用免费服务,等到有更高的需求可以使用商用服务,另外说明商用服务是按Token计费

  • 免费服务开通:仅适合用于体验模型,且受严格的速率限制。平台可能会不定时调整其适用模型、免费额度、有效期等内容

在这里插入图片描述

  • 商用服务:将为您提供商用级别的推理API服务,开放后您可以获取付费API服务

在这里插入图片描述

2、Dify平台单机部署

1、部署Dify-LLM应用开发平台

部署方案云服务器单机部署CCE 容器高可用部署
适用场景规模较小、对复杂性要求低的场景,满足基本公网访问和安全防护需求对应用可靠性、扩展性和性能有较高要求的大型场景
核心资源1 台华为云 Flexus 云服务器 X 实例、1 个弹性公网 IP、1 个安全组多个弹性公网 IP、弹性负载均衡 ELB、NAT 网关、多台 FlexusX 实例、云容器引擎 CCE Turbo 集群、对象存储服务 OBS、分布式缓存服务 Redis、云数据库 RDS for PostgreSQL 实例、云搜索服务 CSS OpenSearch 集群、4 个安全组
架构特点简单直接,单机部署高可用、可扩展,通过多组件协同构建功能全面的架构
关键能力基础公网访问、基础安全防护负载均衡、高可用保障、分布式存储与缓存、数据库服务、搜索服务、多实例协同扩展
复杂性
资源规模单一实例 + 基础网络资源多类型、多实例、多服务组合的资源集群
可靠性保障依赖单实例稳定性通过集群架构、负载均衡和多实例部署实现高可用性,降低单点故障风险
扩展性扩展性有限,需通过单机升级实现资源扩容支持按需横向扩展实例数量,通过容器集群灵活调整资源规模,满足业务增长需求

在这里插入图片描述

2、选择模板:使用一键部署云服务器单机部署,如下页面默认配置,直接下一步

在这里插入图片描述

3、参数配置:按模板要求对部分资源加密的勾选取消(默认是勾选,如果不取消下一步的时候可能会报错),配置dify_version默认是最新版本更改到0.15.2版本,配置ecs_password(云服务器密码,长度为8-26位,密码至少包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种。管理员账户默认root)

在这里插入图片描述

4、资源栈设置:开启回滚设置(开启回滚表示操作失败时,会自动回滚至系统所保存的上一个成功的资源状态。创建后可在资源栈详情页面修改),删除保护可以根据需求开启(防止资源栈被意外删除。创建后可在资源栈详情页面修改)

在这里插入图片描述

5、配置确认,直接点击创建执行计划

在这里插入图片描述

在这里插入图片描述

6、部署-执行

在这里插入图片描述

在这里插入图片描述

7、点击事件观察部署情况,看是否有报错,如果没有等到部署完成即可(预计10分钟左右,这个过程中代表华为云正在创建 1 台华为云 Flexus 云服务器 X 实例,搭配 1 个弹性公网 IP 和 1 个安全组,创建完成后就可以通过浏览器链接直接访问Dify - LLM 应用开发平台)

在这里插入图片描述

8、基本信息页面查看,是否部署成功,显示部署成功即可点击输出,复制浏览器访问链接来访问Dify - LLM 应用开发平台

在这里插入图片描述

在这里插入图片描述

9、通过浏览器访问链接来访问Dify - LLM 应用开发平台,设置管理员账户Dify - LLM 应用开发平台

在这里插入图片描述

10、通过设置的管理员账户信息来登录

在这里插入图片描述

11、登录后显示如下页面,代表Dify - LLM 应用开发平台已经部署成功

在这里插入图片描述

3、Dify平台模型供应商配置

1、Dify - LLM 应用开发平台模型供应商配置(接入DeepSeek)

在这里插入图片描述

2、模型供应商中找到OpenAI-API-compatible并且安装

在这里插入图片描述

3、安装成功如下所示

在这里插入图片描述

4、DeepSeek模型供应商配置(OpenAI-API-compatible供应商)

在这里插入图片描述

5、配置页面

在这里插入图片描述

6、API Key获取:ModelArts Studio控制台,点击API KEY管理,创建自己的API KEY,标签和描述根据自己的填即可,获取到自己的API KEY注意保存(只会显示一次自己的API KEY)

在这里插入图片描述

在这里插入图片描述

7、自定义 API endpoint 地址获取:ModelArts Studio控制台,点击在线推理,选择自己的服务,商用服务或者免费服务的用法相同,点击调用说明获取自定义API endpoint 地址

在这里插入图片描述

8、点击OpenAI SDK复制API接口信息,这个就是自己的API endpoint 地址

在这里插入图片描述

9、Dify - LLM 应用开发平台填写获取到的API KEY和自定义 API endpoint 地址和模型名称

在这里插入图片描述

10、点击保存,页面会显示修改成功,配置成功页面如下

在这里插入图片描述

3、Dify平台模型供应商配置

1、Dify - LLM 应用开发平台模型供应商配置(接入DeepSeek)

在这里插入图片描述

2、模型供应商中找到OpenAI-API-compatible并且安装

在这里插入图片描述

3、安装成功如下所示

在这里插入图片描述

4、DeepSeek模型供应商配置(OpenAI-API-compatible供应商)

在这里插入图片描述

5、配置页面

在这里插入图片描述

6、API Key获取:ModelArts Studio控制台,点击API KEY管理,创建自己的API KEY,标签和描述根据自己的填即可,获取到自己的API KEY注意保存(只会显示一次自己的API KEY)

在这里插入图片描述

在这里插入图片描述

7、自定义 API endpoint 地址获取:ModelArts Studio控制台,点击在线推理,选择自己的服务,商用服务或者免费服务的用法相同,点击调用说明获取自定义API endpoint 地址

在这里插入图片描述

8、点击OpenAI SDK复制API接口信息,这个就是自己的API endpoint 地址

在这里插入图片描述

9、Dify - LLM 应用开发平台填写获取到的API KEY和自定义 API endpoint 地址和模型名称

在这里插入图片描述

10、点击保存,页面会显示修改成功,配置成功页面如下

在这里插入图片描述

4、高质量知识库配置Embedding及Rerank模型
4.1 部署Embedding及Rerank模型

1、登录华为云解决方案实践,选择快速部署Embedding及Rerank模型

在这里插入图片描述

2、点击进入-下滑至方案架构

在这里插入图片描述

3、区域选择

成本预算:3~6元(按需计费:Flexus云服务器X实例2.28元/小时,弹性公网IP EIP0.80元/GB,体验本方案预计成本不超过6元)

在这里插入图片描述

4、选择模板

  • 默认配置下一步

在这里插入图片描述

5、参数配置

  • 按模板要求对部分资源加密取消勾选
  • ecs_password:云服务器密码,长度为8-26位,密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种、

在这里插入图片描述

6、资源栈设置

开启回滚设置:开启回滚表示操作失败时,会自动回滚至系统所保存的上一个成功的资源状态。创建后可在资源栈详情页面修改。

在这里插入图片描述

7、配置确认

在这里插入图片描述

8、创建执行计划

在这里插入图片描述

9、部署

在这里插入图片描述

10、执行计划

在这里插入图片描述

11、基本信息中等待状态改变为部署完成即可完成部署

在这里插入图片描述

在这里插入图片描述

4.2 高质量知识库模型供应商配置
4.2.1 ECS公网IP获取

1、ECS公网IP获取

在这里插入图片描述

在这里插入图片描述

4.2.2 Ollama模型安装

1、安装bge-m3(embedding)和bge-reranker-v2-m3 (reranker)模型供应商

  • Ollama安装

在这里插入图片描述

在这里插入图片描述

2、Ollama模型供应商配置

在这里插入图片描述

  • 模型类型:Text Embedding
  • 模型名称:bge-m3
  • 基础URL:http://ECS公网IP:11434(如上前提有获取流程)
  • 端口号:11434

在这里插入图片描述

3、Xorbits Inference模型安装

在这里插入图片描述

在这里插入图片描述

4.2.3 Xorbits Inference模型安装

4、Xorbits Inference模型配置

模型类型: Rerank

模型名称与模型UID均填写:bge-reranker-v2-m3

服务器URL:http://ECS公网IP:9997

端口号:9997

在这里插入图片描述

在这里插入图片描述

5、模型成功配置

在这里插入图片描述

如上即完成了华为云单机部署以及高质量知识库配置Embedding及Rerank模型的创建和配置,后续即可直接在华为云Dify平台中,直接创建高质量知识库,经济知识库默认配置,不需要特殊创建过程。

资源删除销毁

Tip:

  • 删除资源栈的流程官方文档比较详细可以参考官方文档
  • 资源删除销毁单机部署和CCE集群高可用部署的方式相同

1、进入资源编排服务控制台,找到刚创建成功的资源栈,单击行操作列的删除,页面弹出确认删除框,在输入框中再次输入Delete,单击确定,即可删除

在这里插入图片描述

2、如果启用删除保护的情况下删除资源堆栈,则会显示错误消息

在这里插入图片描述

3、只需要将删除保护关闭再删除即可(此处我并未开启所以不做演示)

在这里插入图片描述

华为云单机部署Dify平台

华为云单机部署 Dify 平台,15 分钟即可自动化完成相关依赖配置,便捷高效。借助 Flexus X 实例,具备高性能架构与场景化加速能力,成本上有柔性算力革新,还提供旗舰级可靠性保障 ,适合个人开发者或团队快速体验 Dify 基础功能,进行小规模试验与原型验证

✅部署便捷:利用华为云一键部署功能,15 分钟可自动化完成 VPC、OBS 等依赖配置,较手动部署效率提升 90%。无需复杂的多实例或高可用架构配置,适合个人开发者或团队快速体验基本功能,10 分钟内即可启动,便于模型调试、小规模应用验证

✅性能卓越:以华为云 Flexus X 实例为算力底座,基于擎天架构,单核性能较传统 x86 实例优化 60%,整体算力达业界 1.6 倍。借助 X - Turbo 引擎,PostgreSQL 查询 TPS 达 1200,是传统实例 6 倍,Redis 延迟 < 10ms,向量检索速度提升至 5000 条 / 秒,模型推理吞吐量增加 35%,支持单实例 15 路并发查询

✅安全可靠:依托华为云跨可用区(AZ)容灾机制,45 秒内可完成故障迁移,可用性达 99.995%。通过 OBS AES - 256 加密、SSL/TLS 链路保护满足等保 2.0 合规,以刚性 SLA 承诺,未达标最高获 300% 资源券赔偿

总结

本指南完整覆盖华为云单机部署 Dify-LLM 开发平台的全流程,通过 Flexus 云服务器 X 实例的一键自动化部署,15 分钟即可完成从环境搭建到模型配置的全链路操作,单核性能较传统架构提升 60% 的同时,成本低至 0.95 元 / 小时。结合 DeepSeek 模型接入与 bge 系列 Embedding、Rerank 模型的高效配置,不仅实现向量检索速度 5000 条 / 秒、PostgreSQL 查询 TPS 达 1200 的高性能表现,更通过跨可用区容灾、AES-256 加密等机制保障系统可靠性。该方案尤其适合中小团队快速验证 LLM 应用原型,且支持平滑扩展至 CCE 集群,为规模化部署奠定基础。

http://www.dtcms.com/wzjs/540756.html

相关文章:

  • 上海高登联合建设网站邯郸如何做企业网站
  • 微网站 pc网站同步如何建设高校网站
  • wordpress大学最新模板下载地址沈阳网站搜索引擎优化
  • 厦门网页建站申请费用app软件定制聚顶科技好
  • 加强和改进校园网站内容建设wordpress站点标题副标题换行
  • 苏州建设网站制作新增备案 网站名字
  • 外贸网站怎么做促销大学生做的网站
  • 网站建设公司天强科技优秀的移动端网站
  • 360怎么变成建设银行首选网站北京软件公司名单
  • 手机微信一体网站建设wordpress 4.8.2 漏洞
  • js获取网站html手机seo快速排名
  • 商务网站建设的组成包括微信下滑小程序怎么关
  • 做自媒体好还是网站好中国十大公司
  • 泰兴城乡建设局网站网站制作的流程
  • 网站建设 php jsp .netseo博客教程
  • PR做视频需要放网站上wordpress段子
  • 优秀的设计网站有哪些网站描述怎么写比较好
  • 宁波公司建网站哪家好asp类似wordpress
  • 自己做的网站本地虚拟上传wordpress 更改页面排版
  • 教育在线网站怎样做直播硅胶东莞网站建设
  • 济南网站开发企业网站文章超链接怎么做
  • ps怎样做网站大图新网
  • 做寄生虫对自己的网站有影响吗川畅科技网站设计
  • 湖北建设厅考试网站如何做家具网站
  • 单位网站建设工作总结金华专业做网站
  • seo品牌优化百度资源网站推广关键词排名wordpress 数据库配置文件
  • 如何建立一个网站共享使用门户网站网络推广方法
  • 中山建设网站aws搭建wordpress
  • 品牌好的佛山网站建设价格2024近期新闻
  • 建筑网站知识大全服务平台官网