当前位置：首页 > news >正文

阿里云智能集团首席技术官云栖大会要点总结

news 2025/10/11 6:06:01

视频播放地址：https://www.bilibili.com/video/BV1D6JXzeEjV

规模与影响力
- 已开源 300+ 模型，下载量破 6 亿，原生及衍生模型数量全球第一。
- 通义千问企业客户超 100 万，衍生模型 17 万+；通义万相累计生成 3.9 亿张图片、7000 万个视频。
旗舰模型升级
- 通义千问-Max：万亿参数，Preview 版已并列 GPT-4 位列全球第三；正式版在指令遵循、Coding、Agent 能力再提升。
- 深度思考（Thinking）模式：AIME 数学奥赛满分水平，逐步上线。
多模态模型
- Qwen-VL-Max：256 K 上下文，2 小时视频理解，3D-grounding，可操作电脑/手机。
- Qwen-Omni：单模型融合文本、图像、音频、视频、语音生成，实时交互延迟降低。
- Qwen-Code-Pro：与 Queen Code IDE 联合训练，推理加速 30%+，token 消耗下降，安全扫描内置。
视觉生成
- 通义万相 2.5-Preview：原生多模态 Transformer，一次性生成 10 s@1080p 音画同步视频；支持图+音频驱动、电影级运镜、图文排版、科学图表。
- 数字人：5 s 音视频即可克隆声音+表情；支持动作/语音驱动、视频换人等。
语音模型
- 通义百灵：ASR 与 CosyVoice 3.0 统一品牌，嘈杂环境识别、多音色合成、行业词定制。
下一代架构
- Qwen-Next：混合注意力、高稀疏、多-token 预测，384 B 版本训练资源节省 40%，吞吐↑10×。

四大核心能力
- 复杂任务自主规划、决策、反思
- 多层次多模态记忆（具象→抽象，用户级个性化）
- 信息增强：本地知识、实时数据、领域专家库快速接入
- Action：调用工具、与现实交互、获得反馈闭环
产品/工具链
- 百炼 Agent 平台：低代码拖拽 & AgentScope SDK 双模式；内置 Deep-Research、Rec、Computer-Use 等 Agent。
- 工具生态：
  – 原生支持 MCP 协议，15000 容器/分钟沙箱启动；
  – 私有化 API 一键转 MCP 服务；
  – 强化学习流水线：数据收集→清洗→奖励模型→policy 迭代。
- 部署：一键云端发布，企业级高可用、弹性伸缩、可观测。

算力
- 盘久超级节点：单柜 128 卡，350 kW 供电，全液冷，兼容主流 GPU/NPU。
- 灵骏集群：单集群可扩展至数十万卡，异构算力（容器/裸金属/虚拟机），故障自动恢复率 98%+。
网络
- HPN 8.0：自研交换机+光模块+RDMA，7.0→8.0 从万卡到十万卡级 DC。
- 跨 DC/跨 Region 高带宽，全球加速网络，VPC 内 RDMA 支持。
存储
- CPFS：单客户端 40 GB/s 吞吐，100 万 IOPS，智能冷热分层，成本↓60%。
- OSS 多模态升级：Vector Bucket 支持 Embedding 存储与检索。
平台层
- PAI 训练：计算-通信重叠、序列感知调度，通义大模型训练提速 3 倍。
- PAI 推理：多级量化、Speculative Decoding、MTP，延迟↓50%，吞吐↑3×。
- 强化学习框架：同步/异步/多轮交互，训推资源弹性混部。
数据与安全
- Lindata/MaxCompute 原生多模态，自然语言数据分析。
- 全链路安全：训练数据脱敏、模型加密、输入提示词过滤、内容合规审计、AI 对抗攻击拦截率↑40%。
部署与弹性
- 百炼模型服务：国内+国际双站，1000+ 模型，100 TPS 级生成，12 个月调用量↑15 倍。
- 企业定制：预训练阶段即可融合私有数据，全工具链（训练→评测→部署）开放。