当前位置: 首页 > news >正文

华为云Flexus+DeepSeek征文 | 初探华为云ModelArts Studio:部署DeepSeek-V3/R1商用服务的详细步骤

华为云Flexus+DeepSeek征文 | 初探华为云ModelArts Studio:部署DeepSeek-V3/R1商用服务的详细步骤

  • 前言
  • 一、华为云ModelArts Studio平台介绍
    • 1.1 ModelArts Studio介绍
    • 1.2 ModelArts Studio主要特点
    • 1.3 ModelArts Studio使用场景
    • 1.4 ModelArts Studio产品架构
  • 二、访问ModelArts Studio大模型即服务平台
    • 2.1 登录华为云
    • 2.2 进入ModelArts Studio介绍页
    • 2.3 进入ModelArts Studio控制台
    • 2.4 配置ModelArts委托授权
    • 2.5 华为云账号充值
  • 三、开通DeepSeek-V3/R1商用服务
    • 3.1 预置服务介绍
    • 3.2 开通商用服务DeepSeek-V3-32K
    • 3.3 开通商用服务DeepSeek-R1-32K
  • 四、商用服务DeepSeek-V3/R1对比
  • 五、商用服务DeepSeek-V3/R1在线体验
    • 5.1 DeepSeek-V3-32K在线体验
    • 5.2 DeepSeek-R1-32K在线体验
    • 5.3 DeepSeek-V3/R1调用统计功能
  • 六、使用体验与总结

前言


华为云ModelArts Studio作为一站式大模型即服务平台,凭借其强大的模型管理能力和简洁易用的操作界面,为企业和开发者提供了高效、稳定的AI服务部署体验。平台全面支持主流大模型的快速接入与商用服务开通,显著降低了AI应用开发的技术门槛。通过集成自动调优、资源按需分配、API调用监控等智能功能,ModelArts Studio实现了从模型训练到生产落地的无缝衔接。本文将以部署DeepSeek-V3和DeepSeek-R1商用服务为例,带您深入了解这一平台的强大能力与实际应用价值。


一、华为云ModelArts Studio平台介绍

1.1 ModelArts Studio介绍

🌟 平台介绍

ModelArts Studio是华为云提供的一个大模型即服务平台(MaaS服务),旨在简化模型开发流程,支持定制化大模型的开发,并使这些模型能够无缝集成到业务系统中。通过降低企业AI应用的成本和难度,ModelArts Studio助力企业快速实现AI技术落地。

📌 核心价值图谱

维度价值体现
技术门槛零代码开发,免调优,降低90%技术投入
成本效率按需付费,资源利用率提升60%,成本下降50%
开发效率开发周期缩短至传统方案的1/3
业务创新聚焦业务逻辑,快速落地差异化AI应用

👉 立即体验:通过ModelArts Studio,让大模型成为企业数字化转型的核心驱动力,解锁智能未来!

在这里插入图片描述

1.2 ModelArts Studio主要特点

  1. 全栈模型生态,性能卓越
    主流模型全覆盖:集成Llama、Baichuan、Yi、Qwen、DeepSeek等99%业界SOTA开源模型,预适配昇腾算力底座,精度与推理性能显著提升。
    零代码自动化开发:沉淀100+行业调优经验,提供一键训练、自动超参优化、标准化流水线,无需手动调参,开发周期缩短50%+。
    昇腾深度优化:基于昇腾算子与显存优化技术,训练/推理效率大幅提升,预置最优超参配置,开箱即用。

  2. 资源灵活可控,成本优化
    💡 按需付费,弹性扩缩:分钟级获取算力资源,按实际使用收费,避免闲置浪费,降低AI入门门槛。
    💡 高可用性保障:多数据中心部署,支持故障快速恢复(快恢)断点续训,确保训练任务不中断,保护项目连续性。

  3. 智能应用快速构建
    🤖 Agent开发加速器:提供优质Prompt模板与智能Agent沉淀,支持复杂任务拆解(如多系统协同决策),快速生成业务专属智能体。
    🤝 组件化生态集成:即插即用MCP Server、LangChain、RAG、Guard等工具,一站式构建智能问答、知识管理、流程自动化等应用。

  4. 一站式全生命周期服务
    📦 全流程工具链:覆盖模型调优、压缩、部署、评测等环节,支持「即开即用」,无需跨平台切换。
    ⚙️ 标准化流水线:内置性能与精度评价体系,自动化完成模型优化,确保全场景高性能表现。

1.3 ModelArts Studio使用场景

  1. 行业大模型定制开发
    🔹 金融/医疗/制造:基于开源模型微调,快速构建风控分析、智能诊断、供应链优化等垂直领域大模型。
    🔹 优势:无需从头训练,依托昇腾优化提升行业数据适配性,降低定制成本。

  2. 复杂业务流程自动化
    🔹 企业级决策支持:拆解项目级任务(如跨部门协作、多系统调用),通过智能Agent实现自动化决策与执行。
    🔹 典型场景:智能客服(多轮对话+知识库检索)、工单自动化处理、数据分析报告生成。

  3. 低成本AI创新探索
    🔹 中小企业/初创团队:通过按需付费模式,零门槛试用大模型能力,快速验证业务场景(如营销文案生成、智能质检)。
    🔹 优势:分钟级启动开发,无需预置算力资源,试错成本降低80%。

  4. 高性能实时推理场景
    🔹 实时交互应用:智能问答、推荐系统、工业实时监控等,依托昇腾优化保障低延迟、高并发推理。
    🔹 技术支撑:多数据中心容灾架构,确保7×24小时稳定服务。

  5. 多模态应用集成
    🔹 智能内容生成:结合RAG(检索增强生成)与Guard(安全防护),构建企业级知识中台、数字人交互等多模态应用。
    🔹 组件化优势:快速集成LangChain等工具,实现「数据-模型-应用」闭环。

1.4 ModelArts Studio产品架构

华为云ModelArts Studio产品架构集成了模型服务、应用服务和资源管理等多个模块,支持从模型调优、压缩到部署的全生命周期管理,并提供丰富的插件和应用体验。其底层依托于ModelArts Standard平台,涵盖模型开发、数据工程、训练和推理等核心功能,确保高效灵活的AI开发流程。通过统一资源调度和AI专属资源池,ModelArts Studio实现了资源的按需使用和快速扩展,助力企业轻松应对复杂多变的业务需求。

在这里插入图片描述

二、访问ModelArts Studio大模型即服务平台

2.1 登录华为云

华为云官网:https://www.huaweicloud.com/,在电脑浏览器打开华为云官网后,点击“登录”选项,输入自己的华为云账号和密码,登录华为云官网。

在这里插入图片描述

2.2 进入ModelArts Studio介绍页

在华为云首页的产品——查看所有产品,搜索框内输入ModelArts Studio,即可看到ModelArts Studio大模型即服务平台,点击进去即可。

在这里插入图片描述

同时,可以直接输入ModelArts Studio的地址:https://www.huaweicloud.com/product/modelarts/studio.html,进入ModelArts Studio的介绍页。

在这里插入图片描述

2.3 进入ModelArts Studio控制台

在ModelArts Studio介绍页中,我们点击“ModelArts Studio控制台”。

在这里插入图片描述

刚开始进入时,会提示我们勾选“ModelArts Studio服务声明”,勾选后,选择“确定”选项即可。

在这里插入图片描述

2.4 配置ModelArts委托授权

在ModelArts Studio控制台首页中,在页面上方我们看到依赖服务的授权提醒,我们按照提示点击“此处”,配置相关授权即可。

在这里插入图片描述

快速添加授权:选择新增委托,权限配置则选择普通模式。将服务列表全选后,选择创建即可。

在这里插入图片描述

回到ModelArts Studio控制台首页后,可以看到授权提示已经消失。

在这里插入图片描述

2.5 华为云账号充值

为避免测试过程中出现部署失败等问题,请确保自己的华为云账号余额充足,建议保持账户余额大于10元。

  • 华为云充值地址:https://account.huaweicloud.com/usercenter/?region=cn-north-4&locale=zh-cn#/userindex/allview

在这里插入图片描述

三、开通DeepSeek-V3/R1商用服务

3.1 预置服务介绍

在ModelArts Studio控制台首页中。我们依次选择模型推理—在线推理——预置服务,可以看到商用服务和免费服务列表。预置服务为平台已部署好的服务,无等待时间,按token计费、适合快速测试

在这里插入图片描述

  • 服务类型与计费规则
类别描述说明
服务类型免费服务 / 商用服务
免费服务- 仅限用于模型体验
- 受严格的速率限制
- 平台可能不定期调整支持的模型、免费额度及有效期等信息
商用服务- 提供商用级别的推理 API 服务
- 开通后可获取付费 API 使用权限
  • 推理额度与使用方式
项目说明
免费额度单个模型提供 200万 token 推理额度
额度耗尽后处理方式- 可开通商用级别推理 API(仅限区域:贵阳一)
- 或前往“我的服务”部署为自定义服务后按需付费使用
优惠折扣相关信息有关模型服务的优惠折扣发放与使用情况,请前往 费用中心查看

备注:如果需了解更多详情,建议访问华为云官方文档或费用中心页面。

3.2 开通商用服务DeepSeek-V3-32K

我们选择开通商用服务DeepSeek-V3-32K,其专注于内容生成、代码辅助与多轮对话,在长文本处理与逻辑连贯性方面表现出色。

在这里插入图片描述

注意保证华为云账户余额充足,确认开通DeepSeek-V3-32K服务。

在这里插入图片描述

查看DeepSeek-V3-32K服务开通状态,可以看到已经成功开通。

在这里插入图片描述

3.3 开通商用服务DeepSeek-R1-32K

我们选择开通商用服务DeepSeek-R1-32K,它聚焦于检索增强生成(RAG),适用于企业知识库问答、文档分析等强调准确性和可溯源性的场景。

在这里插入图片描述

查看DeepSeek-R1-32K服务开通状态,可以看到已经成功开通。

在这里插入图片描述

四、商用服务DeepSeek-V3/R1对比

  • 📊 模型功能与适用场景对比
对比维度DeepSeek-V3-32KDeepSeek-R1-32K
核心能力内容创作、代码生成、多轮对话、逻辑推理检索增强生成(RAG)、知识库问答、文档分析
输入价格¥0.002 / 千 tokens¥0.004 / 千 tokens
输出价格¥0.008 / 千 tokens¥0.016 / 千 tokens
典型应用场景技术文档撰写、自动化内容生成、智能客服、编程辅助企业内部知识库查询、法律/金融文档解析、精准问答服务
响应速度快速响应,适合实时交互略慢(因涉及外部数据检索),但准确性高
优势特点结构清晰、逻辑连贯、长文本记忆能力强可溯源、精准回答、支持超长文本(如100K+)处理
局限性对实时性知识依赖训练数据,可能存在滞后响应时间较长,不适合极高时效性要求的场景

✅ 使用建议总结

  • 如果业务侧重于内容生成、代码编写或对话理解,推荐使用 DeepSeek-V3-32K,性价比高且响应迅速。
  • 如果应用更注重知识检索、答案可追溯性及超长文本处理,例如在企业知识库、法律合同分析等场景中,DeepSeek-R1-32K 更为合适。

💡 提示:结合具体业务需求测试两种模型的实际表现,将有助于选择最优方案。

五、商用服务DeepSeek-V3/R1在线体验

5.1 DeepSeek-V3-32K在线体验

在已开通的商用服务列表中,我们选择DeepSeek-V3-32K的在线体验选项。

在这里插入图片描述

在DeepSeek-V3-32K的对话框中,我们对其简单提问,让其介绍下自己,如下所示:

在这里插入图片描述

我们让DeepSeek-V3-32K编写一段以端午节祝福为主题的简单静态 HTML 网页代码。

  • 我们在对话框内,输入以下提示词:
请生成一段简单且美观的静态 HTML 代码,用于展示一个以 “端午节祝福” 为主题的网页。具体要求如下:
页面整体风格温馨、传统,体现浓厚的节日气氛;
使用柔和的中国传统色系(如红色、金色、浅绿、粽叶绿等);
包含标题(如“端午安康,粽情祝福!”)、正文祝福语、背景图片或图案(可使用CSS模拟背景图或渐变);
添加字体动画或淡入效果,使页面更具观赏性;
使用 Google 字体(如 "Noto Serif CJK""Ma Shan Zheng" 等书法/手写字体)提升美感;
不使用外部 JS 和图片资源,所有样式通过内联 CSS 实现;
页面适配移动端,结构简洁,加载快速。

在这里插入图片描述

将生成的代码保存到本地电脑并命名为 .html 文件后,用浏览器打开即可查看页面效果,整体呈现非常美观、节日氛围浓厚。

在这里插入图片描述

5.2 DeepSeek-R1-32K在线体验

在已开通的商用服务列表中,我们选择DeepSeek-R1-32K的在线体验选项。

在这里插入图片描述

在 DeepSeek-R1-32K的对话框中,我们对其简单提问,让其介绍下自己,如下所示:

在这里插入图片描述

在DeepSeek-R1-32K对话框内,要求也一首现代诗,要求赞美夏天,要求质量高。给出的提示词如下所示:

请以“夏天”为主题,创作一首现代诗。要求如下:语言优美,富有画面感和情感表达;
运用丰富的意象,如阳光、蝉鸣、荷花、雷雨、西瓜、微风等元素;
表达对夏天的喜爱与赞美,可融入自然之美、生命之力或时光之美的描写;
结构清晰,段落之间有节奏感和层次感;
风格清新自然或深沉热烈均可,避免陈词滥调,追求诗意创新。

生成的现代诗效果如下,整体质量还是令人非常满意得。

在这里插入图片描述

5.3 DeepSeek-V3/R1调用统计功能

ModelArts Studio 平台(MaaS服务)为 DeepSeek-V3 和 R1 模型提供了调用统计功能,可实时监控并记录模型服务的使用情况。 目前,调用统计数据仅针对通过 API 接口调用 产生的请求进行统计,页面体验等前端操作所触发的调用暂未纳入统计范围。

在这里插入图片描述

六、使用体验与总结

🌟 使用体验

在本次部署 DeepSeek-V3 与 DeepSeek-R1 商用服务的过程中,ModelArts Studio 展现出极高的易用性与稳定性。平台界面清晰直观,操作流程简洁流畅,即使是首次使用也能快速上手。从模型选择、服务开通到API调用,每一步都提供了详细的指引和实时反馈,极大提升了部署效率。整体体验下来,不仅感受到华为云在AI工程化落地方面的深厚技术积累,也对企业级AI服务平台的成熟度有了更深认知。

📈 总结展望

ModelArts Studio 凭借其强大的功能集成和灵活的资源调度能力,为企业大模型应用提供了坚实的技术底座。通过本次实践,我们验证了其在实际业务场景中的高效支持能力,特别是在模型性能、计费透明和调用监控方面的表现尤为突出。未来,随着更多大模型的接入和功能的持续优化,ModelArts Studio 将成为推动企业智能化转型的重要引擎。相信在华为云的持续赋能下,AI技术将更加快速、深入地融入各行各业的发展之中。


相关文章:

  • Vue2部分知识点和注意项
  • 鸿蒙分辨率
  • 远程调用 | OpenFeign+LoadBalanced的使用
  • mongodb源码分析session接受客户端find命令过程
  • 基于Java,SpringBoot,Vue,UniAPP医院预约挂号买药就诊病例微信小程序系统设计
  • spring IOC控制反转
  • Python 连接 MinIO (一)
  • 2.2 在javaweb开发中常见后缀文件名的简单理解
  • kali系统的安装及配置
  • python打卡day39
  • MySQL入门笔记
  • mac电脑安装nvm
  • 一个超简易的RMAN备份并保留到异地的方案,仅适用于小规模环境
  • k8s上运行的mysql、mariadb数据库的备份记录
  • IT选型指南:电信行业需要怎样的服务器?
  • uniapp分包配置,uniapp设置subPackages
  • SpringIOC中Bean生命周期
  • TeleAI发布TeleChat2.5及T1正式版,双双开源上线魔乐社区!
  • 如何应对客户对项目进度的过度干预
  • 低代码——表单生成器Form Generator详解(二)——从JSON配置项到动态渲染表单渲染
  • 小程序网站开发者利/上海服务政策调整
  • 网网站开发设计/网络营销策划的内容
  • 发布自己的做家教的网站/seo整站优化一年价格多少
  • 陕西煤化建设集团铜川分公司网站/百度公司官网招聘
  • 苏州网站建设价格/上海发布微信公众号
  • 吉林沈阳网站建设/黑科技引流推广神器