当前位置: 首页 > news >正文

高性能DeepSeek V3上线星辰MaaS平台,更快、更稳定

以DeepSeek模型为代表的MoE技术路线,正不断突破通用大模型的效果上限。其创新的PD优化与大EP推理方案,推动大模型迈向“高性能、低成本、强普惠”的新阶段。

事实上,早在1991年,两位人工智能界的泰斗Michael Jordan与Geoffrey Hinton在论文《Adaptive Mixture of Local Experts》中,就首次提出了MoE框架。随着大模型应用场景愈加复杂和垂直,大模型参数增大的同时,消耗的算力资源和时间成本也随之增加。凭借“稀疏激活、低资源消耗、高模型容量”的优势,MoE逐渐成为大模型开发者的新宠。

DeepSeek模型的成功实践,为MaaS平台厂商指明了方向,也带来了挑战:如何在提供高性能大模型推理服务的同时,实现对成本的极致控制?四月份,科大讯飞技术团队通过深度解析DeepSeek-V3 / R1 推理系统成本,发现除了极致的推理性能及吞吐优化外,大模型成本与算力资源有效利用率、首响用户体验等体系化的综合策略紧密关联。


基于以上洞察,讯飞星辰MaaS平台成功复现了生产级PD(生产部署优化)+大EP(大规模跨节点专家并行),实现了高性能的DeepSeek V3上线

💻 万路并发保障:大规模并发场景下,系统稳定、延迟低,用户体验更流畅;

🚀 请求级指标提升 :TTFT(首Token延迟)性能提升30%,TPOT(单Token生成时间)性能提升35%,显著减少延迟,降低用户「等候感」;


☁  弹性混合云架构:支持多源异构算力调度,灵活应对流量波峰波谷。


高性能DeepSeek V3上线:万路并发无压力,批量处理享半价


讯飞星辰 MaaS 平台始终致力于打造高效、稳定、低成本的大模型推理服务。目前平台上提供星火全系列,以及DeepSeek、Qwen3等共50+个行业主流模型。在对DeepSeek V3推理系统成本进行深度分析基础上,实现了DeepSeek V3推理性能的阶跃:

关键指标对齐官网,万路并发流畅响应

实现生产级PD+大EP复现,极致压榨硬件性能,TTFT、TPOT等关键指标对齐DeepSeek官网,其中,TTFT性能提升30%,TPOT性能提升35%。大规模生产集群吞吐再翻倍,即使在万级并发压力下,依然能保持低延迟与流畅响应。

Batch API升级,高效低价数据处理

重点升级了支持DeepSeek V3的Batch API,为需要处理大规模数据且非实时场景的任务,如:企业级数据分析、内容生产、客户反馈处理等,提供高性价比推理服务且无并发限制,可实现价格比传统调用降低50%,并在24小时内完成任务处理。

弹性混合云架构,流量洪峰更有保障

星辰MaaS平台自研了弹性多源异构混合云架构,以自建算力为中心扩展接入多个混合算力,提供稳定可靠的算力保障用户的流量洪峰,确保服务的稳定性。


针对有大量调用需求的开发者和企业,讯飞星辰MaaS平台提供了专人对接的定制化方案,咨询入口:https://www.xfyun.cn/botIm


模型工具升级:精调方案随心用,500+开源模型自主托管


为进一步降低模型定制门槛,助力开发者快速创新,在提供高性能开源模型的同时,近期,讯飞星辰MaaS平台实现了多项功能上新:


精调方案共享:开放数据分类、表格问答、剧本生成等多个精调方案,零门槛上手,开箱即用,可快速落地在真实业务场景中。


 

以营销创作脚本为例,用户只需输入推广场景、产品卖点、脚本风格、面向人群等资料,即可实现从「创意构思」到「爆款脚本」的全链路智能化生产。


Qwen3全系上线:继率先支持Qwen3旗舰模型Qwen3-235B-A22B和Qwen3-30B-A3B推理之后,目前Qwen3全系模型均已在星辰MaaS平台上线,支持推理/训练,为开发者提供了更为多元的模型选择空间。


开放自主托管渠道:支持开发者自主托管开源模型,包括HuggingFace提供的开源模型(500+)及平台预置模型,均可一键部署,即用即销,进一步降低了开发成本,使开发者和企业得以专注于业务逻辑创新,推动AI创新应用落地。

秉承开放开源理念,下一步,星辰MaaS平台将开源面向大规模生产级的支持PD调度的集群镜像方案,实现拓扑感知调度,兼容SGlang、自研等多种推理框架、自带多源异构弹性混合云调度,支持训推一体潮汐调度,进一步降低多模型、多算力、高并发的大模型集群部署复杂度。


PC端访问讯飞星辰MaaS平台官网:https://maas.xfyun.cn/,即刻体验高性能DeepSeek V3。



关于讯飞星辰MaaS平台

低门槛一站式大模型精调训练平台,助力企业高效构建专属大模型。

开箱即用,上手快:覆盖数据工程、精调训练、推理服务等全生命周期工具链,提供开箱即用、即用即销的平台服务能力。

模型丰富,应用快:支持星火全系列并兼容DeepSeek、Qwen3等,共50+行业主流大模型版本的微调与服务,微调到应用的工期从几天降低到小时级。

成熟训推框架,高可用:构建开箱即用的训推工具与框架,支持lora、full sft等多种训练方式,定制模型按需托管,服务可用性99.95%。

算力利用率高,成本低:实现基于弹性混合云训推算力的潮汐调度,支持即用即销的大模型自主托管推理模式,持续提升算力资源利用率,实现大模型推理成本持续降低。

相关文章:

  • Java无序数组 vs 有序数组:性能对比与选型指南
  • Vehicle HAL(1)--整体介绍
  • Unity-QFramework框架学习-MVC、Command、Event、Utility、System、BindableProperty
  • Unity3D多场景管理框架设计
  • 各国竞争的下一代液晶技术:中国铁电液晶取得重大突破突破
  • ubuntu mysql 8.0.42 基于二进制日志文件位置和GTID主从复制配置
  • 机顶盒CM311-5s纯手机免拆刷机,全网通,当贝桌面
  • VR 电缆故障测试系统:技术革新​
  • Kotlin 活动事件通讯跳转深度讲解
  • (LeetCode 每日一题)3373. 连接两棵树后最大目标节点数目 II(贪心+深度优先搜索dfs)
  • 知识课堂|sCMOS相机可编程快门模式解析
  • [网页五子棋][匹配模块]处理开始匹配/停止匹配请求(匹配算法,匹配器的实现)
  • 【AI智能体】Coze 插件从使用到实战详解
  • 机器视觉2,硬件选型
  • canvas 实现全屏倾斜重复水印
  • Linux应用开发之网络套接字编程
  • 本地部署消息代理软件 RabbitMQ 并实现外部访问( Windows 版本 )
  • .NET8入门:14.ASP.NET Core MVC进阶——Model
  • MMR搜索和LangChain整合Milvus实战
  • 使用 Flutter 开发 App 时,想要根据 Figma 设计稿开发出响应式 UI 界面
  • 商学院网站建设建议/郑州网站推广培训
  • 移动端网站优化/企业内训机构
  • wordpress开启curl/域名seo查询
  • 企业网站备案资料填写单/怎么注册自己的网站域名
  • 工信局网站备案查询/网站设计公司网站制作
  • 湖南省建设厅城乡建设网站/云浮seo