阿里云智能集团首席技术官云栖大会要点总结
阿里云智能集团首席技术官云栖大会要点总结
视频播放地址:https://www.bilibili.com/video/BV1D6JXzeEjV
一、大模型家族(通义系列)
-
规模与影响力
- 已开源 300+ 模型,下载量破 6 亿,原生及衍生模型数量全球第一。
- 通义千问企业客户超 100 万,衍生模型 17 万+;通义万相累计生成 3.9 亿张图片、7000 万个视频。
-
旗舰模型升级
- 通义千问-Max:万亿参数,Preview 版已并列 GPT-4 位列全球第三;正式版在指令遵循、Coding、Agent 能力再提升。
- 深度思考(Thinking)模式:AIME 数学奥赛满分水平,逐步上线。
-
多模态模型
- Qwen-VL-Max:256 K 上下文,2 小时视频理解,3D-grounding,可操作电脑/手机。
- Qwen-Omni:单模型融合文本、图像、音频、视频、语音生成,实时交互延迟降低。
- Qwen-Code-Pro:与 Queen Code IDE 联合训练,推理加速 30%+,token 消耗下降,安全扫描内置。
-
视觉生成
- 通义万相 2.5-Preview:原生多模态 Transformer,一次性生成 10 s@1080p 音画同步视频;支持图+音频驱动、电影级运镜、图文排版、科学图表。
- 数字人:5 s 音视频即可克隆声音+表情;支持动作/语音驱动、视频换人等。
-
语音模型
- 通义百灵:ASR 与 CosyVoice 3.0 统一品牌,嘈杂环境识别、多音色合成、行业词定制。
-
下一代架构
- Qwen-Next:混合注意力、高稀疏、多-token 预测,384 B 版本训练资源节省 40%,吞吐↑10×。
二、AI 开发新范式——Agent(智能体)
-
四大核心能力
- 复杂任务自主规划、决策、反思
- 多层次多模态记忆(具象→抽象,用户级个性化)
- 信息增强:本地知识、实时数据、领域专家库快速接入
- Action:调用工具、与现实交互、获得反馈闭环
-
产品/工具链
- 百炼 Agent 平台:低代码拖拽 & AgentScope SDK 双模式;内置 Deep-Research、Rec、Computer-Use 等 Agent。
- 工具生态:
– 原生支持 MCP 协议,15000 容器/分钟沙箱启动;
– 私有化 API 一键转 MCP 服务;
– 强化学习流水线:数据收集→清洗→奖励模型→policy 迭代。 - 部署:一键云端发布,企业级高可用、弹性伸缩、可观测。
三、AI 基础设施(全栈优化)
-
算力
- 盘久超级节点:单柜 128 卡,350 kW 供电,全液冷,兼容主流 GPU/NPU。
- 灵骏集群:单集群可扩展至数十万卡,异构算力(容器/裸金属/虚拟机),故障自动恢复率 98%+。
-
网络
- HPN 8.0:自研交换机+光模块+RDMA,7.0→8.0 从万卡到十万卡级 DC。
- 跨 DC/跨 Region 高带宽,全球加速网络,VPC 内 RDMA 支持。
-
存储
- CPFS:单客户端 40 GB/s 吞吐,100 万 IOPS,智能冷热分层,成本↓60%。
- OSS 多模态升级:Vector Bucket 支持 Embedding 存储与检索。
-
平台层
- PAI 训练:计算-通信重叠、序列感知调度,通义大模型训练提速 3 倍。
- PAI 推理:多级量化、Speculative Decoding、MTP,延迟↓50%,吞吐↑3×。
- 强化学习框架:同步/异步/多轮交互,训推资源弹性混部。
-
数据与安全
- Lindata/MaxCompute 原生多模态,自然语言数据分析。
- 全链路安全:训练数据脱敏、模型加密、输入提示词过滤、内容合规审计、AI 对抗攻击拦截率↑40%。
-
部署与弹性
- 百炼模型服务:国内+国际双站,1000+ 模型,100 TPS 级生成,12 个月调用量↑15 倍。
- 企业定制:预训练阶段即可融合私有数据,全工具链(训练→评测→部署)开放。
四、一句话总结
阿里云已构建“大模型全栈自研 + Agent 低代码生态 + 十万卡级 AI 基础设施”三位一体体系,面向全球开发者提供从训练、推理到智能体落地的端到端平台。