当前位置: 首页 > news >正文

云栖2025 | 阿里云AI搜索年度发布:开启Agent时代,重构搜索新范式

AI搜索年度发布——Agentic Search创新、云原生搜索引擎进化、AI搜索产品融合升级

年初大模型技术的爆发式发展,使得传统用户搜索场景被颠覆,据某权威研究机构数据显示,超58%的美国用户使用 Google 时不再点击搜索结果,传统搜索流量逐渐转向AI驱动工具,这一转变背后将重构用户搜索的交互逻辑、数据形态与技术架构。

9月26日杭州举行的云栖大会AI搜索专场上,阿里云智能集团计算平台事业部AI搜索负责人邢少敏与产品负责人汤祯捷重磅发布年度AI搜索技术与产品升级成果。阿里云搜索技术通过重塑信息交互范式、Agentic Search 架构创新、优化云原生引擎性能,从传统“信息匹配”迈向“智能问题解决”的全新时代,成为信息交互的核心范式,助力金山办公在文档协作领域实现百万向量/千 QPS 检索能力,货拉拉在物流调度的洪峰压力下保持核心业务极低延迟,实现了客户业务性能突破与成本优化的双赢。

image

AI搜索:颠覆传统,重塑信息交互范式

如今,三大核心趋势正在重塑搜索边界:

  1. 用户交互升级:用户需求从“找到链接”转向“解决问题”,搜索普惠化加速;
  2. 数据模态进化:文本、图像、视频、代码等多模态混合搜索成为刚需;
  3. 主动智能跃迁:以大模型为核、Agent 为引擎的协同架构,实现跨工具、跨数据源的深度推理。

阿里云AI搜索通过技术架构与产品生态的全面革新,正推动搜索从“检索工具”升维为“智能 AI 助手”。

image.png

Agentic Search:AI搜索迈入自主协作时代

演讲中邢少敏详细阐释了阿里云AI搜索的核心突破——Agentic Search 架构创新。该架构通过多 Agent 协同、多模态数据处理与任务自主规划,构建了从“问题提出”到“方案自主生成”的智能闭环。

image.png

其技术优势体现在:

  • 多模态数据处理:支持文档、图像、代码、视频等内容的解析、实体抽取与向量化,覆盖向量引擎、数据库、知识图谱等多引擎协同;
  • 自主任务规划:依托 Qwen3 大模型与短期/长期记忆能力,主 Agent 可动态调用 Code Agent、Browser Agent 等工具,实现复杂问答与多跳推理;
  • 权威测试领先:在 OpenAI 的 BrowseComp 与 Deep Research 评测集中,Agentic Search 检索与推理能力超越 Gemini、OpenAI 等国际主流方案,复杂任务准确率提升超40%。

此外,阿里云构建了覆盖文档解析、多模态向量化、NL2SQL、重排序的全链路 AI 搜索专属大模型体系,并开放 Qwen3-Plus、DeepSeek 等多模态生成模型,为企业提供定制化智能搜索基座。

image.png

云原生引擎突破:性能倍增,成本优化

为支撑 AI 搜索的高并发与复杂计算需求,阿里云发布面向多场景检索的云原生引擎技术升级,实现性能与成本的双重突破:

image.png

Elasticsearch 高性能检索引擎:通过 CPU 向量化计算、存算分离架构,复杂查询性能最高可提升6倍,存储成本降低50%,支持文本、日志、向量、时序等混合检索场景;

向量检索进化:向量检索 GPU 加速,基于高性能 GPU 卡的索引构建性能提升13倍,资源成本下降5倍;结合 BBQ 量化技术,内存占用降低95%,节省20倍机器资源;基于DiskANN技术,低成本支持百亿规模向量检索;

image.png

全模态数据治理:从文档、数据库到湖仓的多源数据,通过结构化抽取、实体关系建模,实现非结构化数据到知识图谱的转化,为多模态搜索提供实时索引能力。

image

产品矩阵融合升级:AI搜索产品的'一横三纵'

从 Agentic Search 创新,再到基于云原生引擎突破向量引擎全面升级AI搜索全模态数据治理等技术能力深耕,在此次年度产品发布中,汤祯捷从产品角度分享了三个主题-融合,加速,开箱即用, 将诸多核心领先 AI 搜索能力融合于在 AI 搜索多产品内的落地规划。打造业内领先的面向 Agentic Search 新时代的'一横三纵'的 AI 搜索产品矩阵。

image.png

1. AI搜索开放平台 - 面向人和 Agent 的 Agentic Search 基础设施。平台方式支撑多个 AI 搜索产品的 AI 原子能力。此为'一横'。

  • 提供多模态解析、视频解析、向量化等全链路AI搜索服务,支持API调用与按量计费。
  • 全链路搜索开发基础能力,覆盖模型微调-模型部署-编排。
  • 搜索链路效果测评:内置 Qwen3 大模型与测评工具,助力企业快速构建 RAG、智能问答等应用。

image

2. 检索分析服务Elasticsearch - 开源企业级AI搜索平台。此为'一纵'。
Elasticsearch 企业版在多类查询场景下的性能提升效果显著,其中文本检索方面,Terms/DateHist 聚合提升 2.59 倍、Query+Sort 查询提升 3 倍、MultiTerms 聚合提升 6.83 倍;向量检索方面,普通向量查询提升 1.7 倍、带过滤条件的向量查询提升 4 倍,全面体现了云原生架构对检索效率的显著增强。

  • 场景增强:支持全文、语义、日志、向量、时序分析等多场景检索分析能力。
  • 引擎加速:NativeES 引擎支持检索性能提升2倍至6倍;检索存算分离降本50%;向量检索内存优化20倍。
  • 发布“企业专属 Agent 知识库”,提供一键 RAG 解决方案,帮助用户构建安全独享的专属知识库。
  • Elasticsearch Serverless 版实现秒级弹性伸缩,保障安全与稳定性。

image

3. 智能检索服务OpenSearch - 深度接入AI原生能力的自研AI Native搜索服务此为'二纵'。

  • LLM智能问答版,集成 DeepSearch/DeepResearch Agent,其 AI+ 专业搜索能力效果领先,支持“答案直出”。
  • 行业算法版 为电商,互联网等行业领域提供高精度定制AI检索能力,全面对接AI搜索平台。
  • 向量检索版,支持多模态数据湖,向量引擎多算法加强(GPU 加速/ RabitQ 量化/ DiskANN 算法),文搜视频/文搜图。

现在起,OpenSearch 不仅是自研搜索服务,更是 AI 原生多模态数据湖搜索。

image.png

4. 向量检索服务Milvus版 - AI向量检索的利器。此为'三纵'。

全托管服务兼容开源 Milvus,新增秒级弹性伸缩、数据分层存储功能;

  • 内核性能提升100%,支持百亿级数据湖检索,集成 Milvus Agent 实现智能化交互。

image

客户实践:AI搜索从工具到智能助手,助力用户实现业务增长

阿里云AI搜索技术落地成效已在头部客户场景中率先验证:金山办公通过 ES 内核级优化实现百万级文档秒级响应,攻克高并发检索瓶颈,并构建冷热数据自动流转的"无感运维"体系;货拉拉依托 ES 重构智能调度系统,成功支撑300+业务应用并发访问的千万级 QPS 洪峰压力,核心业务响应延迟稳定在10ms RT,运维效率提升50%。两大案例揭示了阿里云 AI 搜索技术演进的新逻辑:当技术架构深度适配业务特征,搜索系统正在从"支撑业务"进化为"驱动增长"的核心引擎。

“AI 搜索不仅是在信息获取领域的技术升级,更是用户检索分析体验的跃迁。”

阿里云 AI 搜索通过 Agentic 架构的智能化、云原生引擎的高性能与产品生态的开放融合与加速,正推动搜索从“被动响应”走向“主动服务”。未来,随着大模型、Agent 与云原生技术的深度协同,AI 搜索将进化为每个人的贴身智能助手,引领人类进入信息无界、交互自然的新纪元。

http://www.dtcms.com/a/418790.html

相关文章:

  • 让每次语音唤醒都可靠,公牛沐光重构可观测体系
  • 黄峥的成功之道:重构电商版图的创新密码
  • 数字大健康崛起:艾灸机器人重构就业生态,传统与科技如何共生?
  • 得物笔试题
  • Xenium空间转录组实战 | Xenium Explorer 多样本拼片拆分 ROI 区域圈选
  • 对称加密和非对称加密算法的区别
  • 下载了模板如何做网站太原seo推广
  • 微算法科技(NASDAQ MLGO)探索全同态加密与安全多方计算融合,开启区块链隐私执行新时代
  • JSNES游戏模拟器在 Node.js 环境下的测试使用及高清显示优化
  • pytest生成测试用例,allure生成测试报告
  • 3ds Max to Unity_Ue桥接工具
  • LeetCode算法日记 - Day 56: 全排列II、话号码的字母组合
  • 天津住房城乡建设厅官方网站常州网站优化
  • 超易用前端使用Canvas海报图片生成器
  • 网站开发配置管理计划wordpress怎安装
  • --group-start/--group-end 能不能解决 OpenSSL 1.0 vs 1.1 的优先级问题?
  • 中国品牌网官方网站甘肃网络推广公司
  • 使用Trae配置MySQL MCP智能体进行数据库
  • RPA:开启数字化办公的新时代
  • 打工人日报#20250928
  • 怎么用html做移动网站吗wordpress网页设定
  • 门户网站做等保需要备案哪些php 家政网站
  • 扩散模型-上下文学习第一篇【In-Context Learning Unlocked for Diffusion Models】
  • 信息系统项目的成本管理(智能园区)
  • LeetCode:82.杨辉三角
  • 快速交付与弹性扩展,轻量化5GC融合边缘云与专网方案
  • maptalks-根据后端返回的坐标(WKT格式)在地图上绘制图斑
  • BERT 总结
  • java设计模式五、适配器模式
  • 语音识别的评价指标