当前位置: 首页 > news >正文

云栖实录 | 阿里云发布Elasticsearch Serverless 2.0,重塑AI搜索时代基础设施

2025年9月26日,在杭州云栖大会“AI搜索与向量引擎”分论坛上,阿里云智能集团高级技术专家——贾新禹正式发布 Elasticsearch Serverless 2.0,并首次系统性阐述其技术架构与产品价值。这一全新升级的Serverless解决方案,以“极致弹性、智能核心、AI生态融合”三大技术基石,直面AI搜索时代的工程化挑战,为企业提供一站式构建AI搜索能力的基础设施。

时代鸿沟:AI搜索需求升级与工程落地的矛盾

贾新禹指出,随着语义搜索、多模态检索等能力从“加分项”变为行业标配,企业面临着一道显著的工程鸿沟:开发者不仅要满足高性能、低成本的业务需求,还必须投入大量资源到模型调优、量化算法设计、混合排序等全新的复杂领域,这直接导致开发周期漫长、运维成本高昂。Elasticsearch Serverless 2.0 的核心使命,就是通过将这些技术复杂度封装至底层,让开发者能够回归业务创新

极简AI搜索实战演示 >>

技术基石一:极致弹性基座,持续进化的核心能力

Elasticsearch Serverless 2.0 其核心之一,是为用户提供了一个“极致弹性、持续进化”的 Serverless 基座,让企业无需关注底层版本迭代,即可无缝获取最新能力。

  • 极致弹性:通过将弹性调度下沉至引擎,实现了亚秒级弹性响应。面对流量洪峰,服务平稳无抖动,确保业务连续性。

  • 无感进化:无感集成社区与阿里云最新技术特性。例如,引入 ES 9 的 FilterKNN 优化,使向量检索性能提升 5倍;采用 Lucene 10 的 Merge 算法,让 Merge 性能提升 2倍;目前已集成超 30个 817 以上版本新特性。

  • 深度优化:基于云环境持续进行软硬件协同优化。例如,通过与 JDK 及倚天团队合作,针对 int8 量化查询性能分别提升了 30% 和 50%

技术基石二:内置专家经验的智能核心,化繁为简

针对搜索系统调优门槛高的痛点,Serverless 2.0 内置了智能核心引擎,将专家经验产品化。

  • 智能策略自动调优:内置专家级优化策略,如自动在 _source 中排除向量字段、默认启用 int8 量化,在保障核心召回精度的同时,可节省 70% 的存储和 75% 的内存

  • 专家级智能 Agent:基于 LangGraph 实现的智能 Agent,能复刻专家经验。例如,它能智能推断 RDS 中的 int 类型字段 delete_status 为状态字段,并自动优化为更利于过滤和聚合的 keyword 类型。

  • 查询模板自动生成:Agent 能根据业务场景,自动生成复杂的查询模板。例如,在商品检索场景下,可一键生成融合了文本、向量、多模态的三路 RRF 查询模板,大幅降低新技术使用门槛。

技术基石三:AI生态深度整合,端到端能力全托管

Elasticsearch Serverless 2.0进一步打通阿里云AI搜索生态,构建端到端AI搜索闭环开发者无需再拼凑和运维分散的 AI 服务

  • 无缝集成 AI 平台:无缝集成阿里云 AI 搜索开放平台,提供丰富的搜索专属大模型。这并非通用模型,而是经过大量真实搜索场景打磨的专属模型,让检索和生成效果更专业。

  • 零运维的向量链路:平台提供从数据导入、向量化、索引构建到查询生成的全链路托管,让开发者无需关心复杂的向量链路搭建与运维。

未来展望:Serverless 2.0 让业务回归业务

贾新禹总结称,Elasticsearch Serverless 2.0的核心价值在于通过将弹性、调优和 AI 能力彻底平台化,让企业能从繁重的工程细节中解放出来,真正聚焦于业务创新。这不仅是一次技术升级,更是对开发者生产力的一次彻底解放,将有力推动 AI 搜索技术的普惠化应用。

http://www.dtcms.com/a/549045.html

相关文章:

  • 解决 InfiniteScroll 滚动 BUG
  • Python实现随机选播视频的示例代码
  • 做网站开发多少钱制作网站步骤
  • CSS实现渐变色边框(Gradient borders)
  • 本地部署集成全能平台 Team.IDE 并实现外部访问
  • 深圳科技网站建设字节跳动公司简介
  • 前端技术栈全景图:从HTML到现代框架的演进之路
  • 手机网站 制作睢宁县凌城做网站的
  • DeerFlow介绍
  • Java 程序员的 Vue 指南 - Vue 万字速览(01)
  • TortoiseSVN 右键不显示的解决方法
  • 仓颉语言实战:从零构建闰年判断工具库
  • 网络基础知识简易急速理解---BGP边界网关协议
  • 【Linux网络】Socket编程实战,基于UDP协议的Echo Server
  • 函数列的上下极限
  • C#面试题及详细答案120道(31-40)-- 委托与事件
  • 网站设计排名北京sem分析
  • 网站侧面的虚浮代码六安杂谈网
  • Spring Boot配置篇:详解application.properties和application.yml
  • 【设计模式】装饰器模式大白话讲解
  • GitLab 版本控制系统
  • Apifox 10 月更新|支持实时预览在线文档个性化配置的效果、性能优化、测试能力升级!
  • 基于HTML5、阿里云播放SDK、腾讯云播放SDK开发的M3U8在线播放器
  • 2025年10月AI科技领域周报(10.20-10.26):多模态技术突破 具身智能开启机器人新纪元
  • 生产管理系统详解:高离散制造 – 生产订单数据库设计表(核心表结构)
  • C语言字符串连接实现详解:掌握自定义strcat函数
  • 代码随想录第53天 | 图论二三题
  • 搜索引擎 网站地图做网站需要招聘内容
  • 具身智能3D数字人开放平台「星云」发布:魔珐科技让AI第一次拥有“身体”
  • 世冠科技受邀参加第三十二届中国汽车工程学会年会暨展览会