当前位置: 首页 > news >正文

阿里云智能集团首席技术官云栖大会要点总结

阿里云智能集团首席技术官云栖大会要点总结

视频播放地址:https://www.bilibili.com/video/BV1D6JXzeEjV

一、大模型家族(通义系列)

  1. 规模与影响力

    • 已开源 300+ 模型,下载量破 6 亿,原生及衍生模型数量全球第一。
    • 通义千问企业客户超 100 万,衍生模型 17 万+;通义万相累计生成 3.9 亿张图片、7000 万个视频。
  2. 旗舰模型升级

    • 通义千问-Max:万亿参数,Preview 版已并列 GPT-4 位列全球第三;正式版在指令遵循、Coding、Agent 能力再提升。
    • 深度思考(Thinking)模式:AIME 数学奥赛满分水平,逐步上线。
  3. 多模态模型

    • Qwen-VL-Max:256 K 上下文,2 小时视频理解,3D-grounding,可操作电脑/手机。
    • Qwen-Omni:单模型融合文本、图像、音频、视频、语音生成,实时交互延迟降低。
    • Qwen-Code-Pro:与 Queen Code IDE 联合训练,推理加速 30%+,token 消耗下降,安全扫描内置。
  4. 视觉生成

    • 通义万相 2.5-Preview:原生多模态 Transformer,一次性生成 10 s@1080p 音画同步视频;支持图+音频驱动、电影级运镜、图文排版、科学图表。
    • 数字人:5 s 音视频即可克隆声音+表情;支持动作/语音驱动、视频换人等。
  5. 语音模型

    • 通义百灵:ASR 与 CosyVoice 3.0 统一品牌,嘈杂环境识别、多音色合成、行业词定制。
  6. 下一代架构

    • Qwen-Next:混合注意力、高稀疏、多-token 预测,384 B 版本训练资源节省 40%,吞吐↑10×。

二、AI 开发新范式——Agent(智能体)

  1. 四大核心能力

    • 复杂任务自主规划、决策、反思
    • 多层次多模态记忆(具象→抽象,用户级个性化)
    • 信息增强:本地知识、实时数据、领域专家库快速接入
    • Action:调用工具、与现实交互、获得反馈闭环
  2. 产品/工具链

    • 百炼 Agent 平台:低代码拖拽 & AgentScope SDK 双模式;内置 Deep-Research、Rec、Computer-Use 等 Agent。
    • 工具生态:
      – 原生支持 MCP 协议,15000 容器/分钟沙箱启动;
      – 私有化 API 一键转 MCP 服务;
      – 强化学习流水线:数据收集→清洗→奖励模型→policy 迭代。
    • 部署:一键云端发布,企业级高可用、弹性伸缩、可观测。

三、AI 基础设施(全栈优化)

  1. 算力

    • 盘久超级节点:单柜 128 卡,350 kW 供电,全液冷,兼容主流 GPU/NPU。
    • 灵骏集群:单集群可扩展至数十万卡,异构算力(容器/裸金属/虚拟机),故障自动恢复率 98%+。
  2. 网络

    • HPN 8.0:自研交换机+光模块+RDMA,7.0→8.0 从万卡到十万卡级 DC。
    • 跨 DC/跨 Region 高带宽,全球加速网络,VPC 内 RDMA 支持。
  3. 存储

    • CPFS:单客户端 40 GB/s 吞吐,100 万 IOPS,智能冷热分层,成本↓60%。
    • OSS 多模态升级:Vector Bucket 支持 Embedding 存储与检索。
  4. 平台层

    • PAI 训练:计算-通信重叠、序列感知调度,通义大模型训练提速 3 倍。
    • PAI 推理:多级量化、Speculative Decoding、MTP,延迟↓50%,吞吐↑3×。
    • 强化学习框架:同步/异步/多轮交互,训推资源弹性混部。
  5. 数据与安全

    • Lindata/MaxCompute 原生多模态,自然语言数据分析。
    • 全链路安全:训练数据脱敏、模型加密、输入提示词过滤、内容合规审计、AI 对抗攻击拦截率↑40%。
  6. 部署与弹性

    • 百炼模型服务:国内+国际双站,1000+ 模型,100 TPS 级生成,12 个月调用量↑15 倍。
    • 企业定制:预训练阶段即可融合私有数据,全工具链(训练→评测→部署)开放。

四、一句话总结

阿里云已构建“大模型全栈自研 + Agent 低代码生态 + 十万卡级 AI 基础设施”三位一体体系,面向全球开发者提供从训练、推理到智能体落地的端到端平台。

http://www.dtcms.com/a/465063.html

相关文章:

  • 6. React useState基础使用:useState修改状态的规则;useState修改对象状态的规则
  • 凡科做的网站怎么打不开了天津做再生资源交易的网站
  • AWS Shield 与海外高防服务器的对比分析
  • CTF攻防世界WEB精选基础入门:cookie
  • Vue 中 props 传递数据的坑
  • Descheduler for Kubernetes(K8s 重调度器)
  • Embedding(嵌入):让机器理解世界的通用语言
  • sql练习题单-知识点总结
  • 网站空间域名续费湖南送变电建设公司 网站
  • 国产化PDF处理控件Spire.PDF教程:C#中轻松修改 PDF 文档内容
  • 文件预览(pdf、docx、xlsx)
  • AutoCAD如何将指定窗口导出成PDF?
  • 测试DuckDB电子表格读取插件rusty_sheet 0.2版
  • 用「心率」重塑极限,以「中国精度」见证热爱——宜准产品体验官于淼成功挑战北京七环
  • 18003.TwinCat3配置LAN9253从站XML文件(Ethercat)- 示例(一)
  • 解锁特征工程:机器学习的秘密武器
  • 南昌企业网站开发公司hao123网址导航
  • 中山市有什么网站推广长臂挖机出租东莞网站建设
  • 网站建设多少钱一个月青岛网站公司哪家好
  • PowerBI一直在为个人版用户赋能,QuickBI目前正在拥抱个人版用户,FineBI正在抛弃个人版用户
  • 做网站和平台多少钱dedecms 网站地图 插件
  • 在 C# 中显示或隐藏 PDF 图层
  • 货车智能化配置手机控车远程启动一键启动无钥匙进入
  • Unity 项目外部浏览并读取PDF文件在RawImage中显示,使用PDFRender插件
  • 网站规划与建设评分标准昆明的互联网公司有哪些
  • 免费网站登录口看完你会感谢我wordpress能承载多少数据库
  • PostgreSQL选Join策略有啥小九九?Nested Loop/Merge/Hash谁是它的菜?
  • 数据链路层协议之RSTP协议
  • 让AI说“人话“:TypeChat.NET如何用强类型驯服大语言模型的“野性“
  • .pth文件