云栖2025 | 阿里云自研大数据平台 ODPS 重磅升级:全面支持AI计算和服务
近日,在 2025 云栖大会 ODPS 专场论坛上,阿里云宣布自研大数据平台 ODPS 战略升级,全面支持 AI 计算和服务。正值 ODPS 十五周年之际,作为全球领先的算力底座,ODPS 旗下三款核心产品 ODPS-MaxCompute、ODPS-Hologres、ODPS-DataWorks 协同发布,以"一体化、智能化、服务化"为核心,致力于为企业提供从数据治理、计算处理到智能服务的全链路 AI 原生能力,为自动驾驶实时决策、内容运营分析、智能广告精准投放等场景客户需求及千行百业提供下一代智能数据基础设施。
国家信息中心信息化和产业发展部主任、未来产业和平台经济研究中心主任单志广以“从大数据到数据要素,从数据融合到知识驱动”为主题致开场辞,他表示:当前,数据已经和土地、劳动力、资本、技术一样,成为驱动经济增长的核心动能。随着人工智能的发展,大数据平台需要从'计算数据'向'孵化智能'转变,从“数据驱动”向“知识驱动”转型,推动丰富的行业数据转化为知识资产,在国家“人工智能+”战略行动的指引下,共同推动人工智能与大数据产业的深度融合发展,着力打造 AI 原生的智能计算引擎,加速构建“要素化、智能化、生态化”的数据发展新格局,助力数字中国建设向更高水平、更高质量不断跃升。
国家信息中心信息化和产业发展部 单志广主任现场致辞
ODPS-MaxCompute:AI 原生高性能数据仓库全面升级
MaxCompute 负责人张治国在会上分享此次 MaxCompute 的核心发布:作为 ODPS 的算力基石,MaxCompute 本次升级聚焦于为 AI 工作负载提供极致弹性与高性能支撑。
性能与成本优化达到新高度:MaxCompute 在 全托管、性价比、稳定及易用多方面提供企业级 SaaS 云数仓能力,支持存算分离,存算可独立扩展,集群自动弹性,用户可 10 秒内拉起 10 万 CU 计算。通过多租共享架构,租户可共享资源来提高资源利用率。 MaxCompute 通过全链路性能优化,在实现 BigQuery 等友商产品快速搬站的同时,可降低 50%以上成本。在海外客户的实际应用中,MaxCompute 在真实 Workload 中的性能已达到竞品的 1.8 倍。
AI 异构算力革命:面对复杂的 AI 计算场景,MaxCompute 全面升级 Data+AI 场景的引擎能力。MaxCompute SQL 和 Python 支持模型函数功能(MaxCompute AI Function),实现大模型与 MaxCompute 深度集成,提供开箱即用的 Qwen3 系列、DeepSeek 等主流模型及自定义模型托管能力,支持用户基于自身场景需求上传自定义模型,或链接远端模型服务。在算力上,全面支持 CU/GU 异构计算资源混合调度,用户可基于统一调度策略按需在 SQL、Python 作业中使用不同算力资源。
MaxFrame 推出面向 AI 场景的新一代原生分布式 Python 引擎 DPE,支持数据预处理,ML 训练推理,异构资源计算,Python 原生 UDF 以及 AI Function 等计算场景。
通义实验室通过 MaxCompute 的 EB 级数据存储能力和 Serverless 架构,实现大模型训练所需海量数据的高效清洗、去重工作,为通义千问 &通义万相提供稳定可靠的数据支持。
拓展近线计算能力引擎:MaxCompute 支持基于 Delta Table 和 Delta Live MV 的增量计算 以及 MaxQA 查询加速 等特性,满足大数据业务从离线化、批处理 向 近实时化、Data+AI 方向扩展,满足市场多样化计算场景需求。全新推出的 Delta Table 统一数据底座,支持离线+近实时一体化数据加工和分析,完全替代 MaxCompute Table Format 1.0。Delta Live MV 通过声明式 SQL 实现增量计算,免运维、自动数仓分层,有效平衡数据新鲜度与成本。
多模态数据管理:在今年的升级中,MaxCompute 提供更开放的数据交互能力,以湖仓一体的架构,支持更多样的数据模态的链接、管理与计算,同时为更多样的引擎提供便捷与安全的数据访问能力。通过 MaxLake 提供统一的 Read/Write APIs 和 Catalog API,支持与开源工具深度集成。
ODPS-Hologres 4.0:一站式 AI 数据分析平台
Hologres 负责人姜伟华在会上分享 Hologres 4.0 全新升级一站式 AI 数据分析平台,实现了向量 + 全文 + 标量的一站式多模混合查询,通过结合内置的 AI Function 一键部署大模型,轻松构建面向 AI 的一站式、多模态、高性能分析平台。
向量检索四项性价比世界第一:全新自研的内存+磁盘混合索引技术与 RabitQ 量化算法,在同等成本下,性能远超行业主流产品,以 20%的内存成本实现 95%以上的检索性能,单分片可支持 0.5 亿向量,助力企业低成本实现千亿向量数据的毫秒级检索,登顶 VectorDBBench 性价比榜单四项第一,实现高性能向量检索普惠化,成为全球最快向量数据库!
OLAP 分析性能世界第一:在原有 TPC-H 30TB 性能世界第一的成绩下,Hologres 4.0 继续刷新各类 Benchmark 性能测试,ClickBench 内表性能中国第一,湖表(Paimon)性能对比 3.0 提升 100%,业界领先;JSONBench 在 10 亿行数据集下,性能中国第一;Hologres 让云上客户跟随版本更新即可实现性能优化,享受云上技术红利。
多模一站式融合查询:在标量、向量基础上,支持高性能全文检索召回能力,对非结构化文本数据进行高性能搜索和召回,在搜索引擎、企业文档管理系统、日志分析平台等场景,帮助业务在海量非结构化文本数据中实现精准定位和知识挖掘。Hologres4.0 实现了"一份数据、多模分析",完美支撑 RAG、多模态搜索等复杂场景。
AI Function 原生集成大模型:内置 AI Function,在 Hologres 内可直接开通 GPU,一键部署 AI 资源与模型,支持通过 SQL 直接调用模型进行推理;通过 Object Table 构建索引直接访问 OSS 上的非结构化数据,并与 Dynamic Table 联动进行数据增量加工,实现非结构化数据的自动、增量处理,并直接进行向量 + 全文 + 标量的一站式高性能多模混合查询。
理想汽车基于 Hologres+Flink 构建了万亿车联网信号毫秒级响应实时分析平台,在成本与原先持平的情况下,写入性能提升 200%,实现万亿数据秒级写入。通过 Hologres 的 JSONB 存储分析能力支持 10000+车机信号动态增减,满意业务灵活性需求。在增量场景使用 Hologres Dynamic Table 增量加工并使用 Serverless 资源按量付费,成本降低 35%,需求交付效率提升 10 倍。
Hologres 在高性能实时读写、增量计算、计算组隔离、Serverless,JSONB 智能压缩存储等核心技术上突破,成功支撑理想汽车在智能座舱、智能诊断等核心业务链路迭代,实现万亿级数据洪流下的秒级决策。Hologres 助力新能源汽车在智驾场景实现多模一站式高性能 AI 数据分析,加速产业智能化进程。
ODPS-DataWorks:从数据开发治理平台到"Data+AI"一体化数据中枢
DataWorks 产品负责人田奇铣在会上分享此次 DataWorks 的核心发布,DataWorks 数据开发治理平台向 Data+AI 一体化持续进化,演进为整个数据智能生态的"数据中枢"。
Data Studio,云原生 Data+AI 一体化开发平台:提供完全隔离的个人开发环境,支持 CPU/GPU 资源实例,可自定义容器镜像,支持 Jupyter Notebook、Python、Qwen Code 等工具,开发者可获得媲美本地开发环境的体验。同时 Data Studio 与 PAI 产品深度集成,提供 AI/ML 工程(PAI DLC/PAI Flow)及 Gen AI 应用开发(LangStudio),一站式构建 Data+AI Pipeline,为大模型后训练、智能驾驶、具身智能等场景在半结构化与非结构化数据处理、数据科学及 AI 训练等工作上,为开发者提供高效、便捷的一站式开发体验。
智能服务,从 Copilot 到 Agent 的飞跃:DataWorks Copilot 深度集成于 SQL 编辑器,通过接入 Qwen3 和 DeepSeek 系列模型提供智能代码补全、SQL 生成、SQL 优化等能力,并全新推出 NES(Next Edit Suggestions)。全新发布的 DataWorks Agent,支持通过自然语言描述 ETL 需求,Agent 可自主进行意图识别、需求理解、任务分解、代码编写、工作流构建与发布,自动化完成数据开发。同时,数据治理 Agent 将 DataWorks 主动式数据治理迈向全新的自主式数据治理阶段,不仅能够主动发现需要治理的问题,同时支持自主优化和解决问题。目前,DataWorks Agentic NL2SQL 服务在被誉为"最接近真实企业场景"的 NL2SQL 权威榜单 Spider 2.0 中,以 61.24% 的执行准确率荣获榜单第一。
同时,全新发布 DataWorks ChatBI,以智能对话为核心,实现从问题理解到可视化报告的全流程自动化分析,助力业务人员高效完成复杂数据洞察。
触发式调度引擎:面向 AI 时代的数据处理需求,DataWorks 自研的大规模任务调度引擎全新升级触发式调度能力,支持 API、事件等多种方式触发,单集群每日可调度千万级任务,秒级调度延迟,分钟级故障自愈,高效、稳定驱动 Data+AI Pipelines。
AI Function:DataWorks Serverless 资源组全新支持大模型部署,支持一键部署 Qwen3、DeepSeek 系列模型及 Embedding 模型,支持 DataWorks AI Function 便捷调用,小尺寸模型调用性能提升近 10x。可在数据集成及数据处理过程中,实现如 Embedding、文本打标、内容安全检测等,加速半结构化/非结构化数据处理效率。
多模态数据统一管理:从结构化数据到半结构化数据、非结构化数据,DataWorks 全新推出多模态数据管理能力,支持多模态数据目录、语义检索,全新提供数据集管理,并可一键挂载至 Data Studio 个人开发环境,提供便捷访问。全新升级多模态端到端数据血缘,覆盖从数据集成、数据处理、AI 训练、模型、推理服务全链路,实现数据可追溯,AI 模型效果可跟踪。
ODPS 迈向智能化的下一个十五年
走过十五年,ODPS 从支撑阿里内部业务,到成为普惠的云上基础设施,再到今天全面拥抱 AI,ODPS 的每一次进化都紧扣技术发展的脉络。
阿里云通过 AI 原生一体化的智能数据平台,正持续降低 AI 技术的使用门槛,赋能千行百业挖掘数据价值,决胜 AI 新时代。