当前位置: 首页 > news >正文

Elasticsearch 是 NVIDIA Enterprise AI Factory 验证设计中推荐的向量数据库

作者:来自 Elastic Aditya Tripathi, Hemant Malik

Elastic 现已与 NVIDIA Enterprise AI Factory 验证设计集成,为用户提供推荐的本地向量数据库。该验证设计为企业构建和部署本地 AI Factory 提供了框架。

用于多模态检索增强生成(RAG)场景的 Elasticsearch 向量数据库

Elasticsearch:适用于 NVIDIA AI Factory 的企业级向量数据库

验证设计结合了 NVIDIA 加速计算与 AI 软件,优化了 AI 模型部署、多模态数据提取以及使用 Elasticsearch 的嵌入生成 —— 一个经过大规模验证的向量数据库,可用于存储和搜索所有 AI 数据。客户可以在 NVIDIA AI Factory 上使用 Elasticsearch,通过验证设计构建 agentic AI 应用。

与 Elasticsearch 搭配的 NVIDIA Enterprise AI Factory 验证设计,帮助企业通过完整的预构建蓝图加速 AI 应用。

但这项合作还有更多亮点 —— 想想 GPU 加速的向量搜索!

接下来是什么?

Elastic 将使用 NVIDIA cuVS —— 一个开源 GPU 加速向量搜索库 —— 创建新的 Elasticsearch 插件,在两个关键领域引入 GPU 加速:

  1. 索引构建时间:借助 NVIDIA GPU,可以减少在 Elasticsearch 中构建和更新向量索引所需的时间。
  2. 查询性能:通过 GPU 加速执行 kNN 向量搜索,目标是实现更低的延迟和更高的吞吐量,以支持 Elasticsearch 中的实时 AI 应用。

这次与 NVIDIA 的 GPU 加速合作将建立在 Elastic 团队之前的优化基础之上,包括 CPU SIMD、BBQ(更优的二进制量化)和更快的过滤式 HNSW,使 Elasticsearch 成为用户首选的向量数据库。敬请关注 Elasticsearch Labs 的更多更新。

本帖中描述的任何功能或功能发布的时间安排,完全由 Elastic 自行决定。当前尚未提供的任何功能或功能,可能不会按时发布,甚至可能永远不会发布。

在本文中,我们可能使用或提及了第三方生成式 AI 工具,这些工具由其各自所有者拥有和运营。Elastic 无法控制这些第三方工具,对其内容、运行或使用不承担任何责任,也不对因你使用这些工具而可能造成的任何损失或损害承担责任。在使用 AI 工具处理个人、敏感或机密信息时,请务必谨慎。你提交的任何数据都可能被用于 AI 训练或其他用途。无法保证你提供的信息会被安全或保密地处理。在使用任何生成式 AI 工具之前,你应熟悉其隐私政策和使用条款。

Elastic、Elasticsearch 及相关标志是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:Elasticsearch is a recommended vector database in the NVIDIA Enterprise AI Factory validated design | Elastic Blog

http://www.dtcms.com/a/290577.html

相关文章:

  • WAMP配置局域网https服务
  • 旋转目标检测(Rotated Object Detection)技术概述
  • 漏洞扫描 + 渗透测试:双轮驱动筑牢网络安全防线
  • Pandas - JSON格式数据操作实践
  • iOS —— 3Gshare项目总结与思考
  • 【网络安全】DDOS攻击
  • Python Matplotlib中的fontdict参数说明
  • 学习日志7.21
  • 【HarmonyOS】ArkUI - 声明式开发范式
  • 产品剖析之AI创作与协作的未来革新者Flowith
  • 【编程语言】C、C++、C#深度对比:三种语言的演进历程与应用场景
  • zabbix企业级分布式监控环境部署
  • Django关于ListView通用视图的理解(Cursor解释)
  • 牛客周赛 Round 101题解
  • 北京-4年功能测试2年空窗-报培训班学测开-第五十六天
  • 阶段1--Linux中的网络配置
  • rt-thread多线程消息队列通信
  • 【SAP-CO】成本控制范围
  • 清理磁盘空间
  • 4 种更新的方法将消息从安卓传输到 Mac
  • JavaEE初阶第十期:解锁多线程,从 “单车道” 到 “高速公路” 的编程升级(八)
  • 用 Three.js 实现 PlayCanvas 风格 PBR 材质教程(第二篇):核心参数与光照模型
  • CS课程项目设计4:支持AI人机对战的五子棋游戏
  • RustDesk自建服务器完整部署指南:从零开始到成功连接。成功解决rustdesk报错:未就绪,请检查网络连接
  • Linux的系统调用机制总结
  • [Python] -项目实战10- 用 Python 自动化批量重命名文件
  • 重学前端008 --- CSS 无障碍 Quiz
  • 《高并发优化方案一》:本地锁 + 分布式锁实战详解
  • Excel函数 —— TEXTJOIN 文本连接
  • 支持不限制大小,大文件分段批量上传功能(不受nginx /apache 上传大小限制)