当前位置: 首页 > news >正文

Elasticsearch:隔离环境中的高级向量搜索

作者:来自 Elastic Josh Phifer

对于没有外部网络连接的隔离环境中的组织来说,实施最新的搜索和 AI 技术可能极具挑战,甚至几乎不可能。然而,Elastic 的客户 —— 包括国家安全和国防等高敏感行业 —— 十多年来一直依赖 Elastic 的敏捷技术,在隔离环境甚至技术套件上执行关键任务。让我们以多模态向量搜索为例,仔细看看这类用例是如何实现的。

随着 AI 越来越深入地嵌入组织的日常运营,从海量结构化和非结构化数据中提取相关且有上下文的信息变得前所未有地重要。如果无法对所有数据类型进行整体查询和分析,生成式和智能体 AI 的有效使用将受到限制。公共部门常见的数据挑战包括:

  1. 缺乏开发人员:虽然生成式 AI(GenAI)工具可能易于获取,但组织可能缺乏有效实施这些工具所需的技术专长。
  2. 数据量庞大:公共部门组织面临前所未有的数据量,其中许多数据受严格法规或机密等级的限制。
  3. 数据未准备好供 AI 使用:关键信息常存储在 PDF、图表和视频等格式中,难以提取出相关洞察。

RAG:一种高效的 AI 数据检索模型

许多公共部门组织发现,很难训练甚至微调大型语言模型(LLM)来处理员工和利益相关者的各种查询。他们希望即使数据复杂或分散,也能直接利用专有数据与 AI 配合使用。

检索增强生成(RAG) 是一种可扩展的解决方案,能够应对时间和资源有限、以及需要处理海量结构化与非结构化数据的更大挑战。在 Elastic 的 RAG 模型中,用户的问题在提交给 LLM 之前,会先查询我们的向量数据库,通过向量搜索从组织的专有数据中提取相关上下文。这个步骤(即上下文层)显著缩小了 LLM 输出所依赖的数据范围。智能体 AI 进一步发展了这一模型——查询可与 AI 智能体交互,执行多个子查询,并在用户与 LLM 之间充当中介。

多阶段检索与多模态搜索:应对复杂数据类型

与此同时,多模态搜索用例正在迅速扩展,组织正在寻找更直观、更强大的方式来跨多种数据类型检索信息。通过结合文本、图像、音频和视频输入,多模态搜索让用户能够以更自然、更有意义的方式与系统交互。公共部门在这方面有多个典型用例,因为大量知识往往存储在极长且密集的 PDF 和视频记录中。能够同时在这些内容中进行搜索,是一项极有价值的能力,可显著提升团队寻找答案的速度与准确性。

Elastic 还使用 混合搜索,将关键词搜索元素与向量搜索相结合,作为多阶段检索的基础。这使系统能够重新评分、重新排序,甚至应用个性化,从而找到用户所需的确切视频或 PDF 来回答问题。这种方法认识到,获得近似结果与获取高度精确结果所需的技术不同,从而使 Elastic 能够提供高度定制的数据集。

这是什么样子?

要了解更多关于在隔离环境中启用高级向量与多模态搜索的示例和信息,请观看我们的网络研讨会或下载白皮书。

本文中描述的任何功能或特性发布及时间仍由 Elastic 全权决定。任何当前不可用的功能或特性可能无法按时提供,甚至可能无法提供。

在本文中,我们可能使用或引用了第三方生成式 AI 工具,这些工具由各自所有者拥有和运营。Elastic 无法控制这些第三方工具,也不对其内容、操作或使用承担任何责任或义务,也不对你使用这些工具可能产生的任何损失或损害负责。使用 AI 工具处理个人、敏感或机密信息时请谨慎。你提交的任何数据可能用于 AI 训练或其他目的。无法保证你提供的信息将被安全或保密地保存。你在使用任何生成式 AI 工具前,应熟悉其隐私政策和使用条款。

Elastic、Elasticsearch 及相关标识是 Elasticsearch B.V. 在美国及其他国家的商标、标识或注册商标。所有其他公司和产品名称均为其各自所有者的商标、标识或注册商标。

原文:https://www.elastic.co/blog/advanced-vector-search-in-air-gapped-environments

http://www.dtcms.com/a/529574.html

相关文章:

  • 网站关键词排名优化推广软件模板下载网站
  • 松滋网站开发建了网站怎么装饰
  • 移动端网站怎么做优化龙华网站建设主要工作
  • 网站建设和优司怎么样电商分销平台
  • defaultdict介绍
  • 优惠券网站做淘客违规吗广告设计与制作专业描述
  • 大型网站域名徐州圣道网络科技有限公司
  • 网站开发维护人员可做易企秀的网站
  • ssh远程登录那些事
  • IOT项目——电源入门系列-第一章
  • 上海品划做网站网站开发一般用哪个浏览器
  • Spring与JSR-330标准注解对比指南
  • GitHub等平台形成的开源文化正在重塑鸡腿肉
  • 网站ip地址范围网络上市场推广
  • 2025年江西省职业院校技能大赛“大数据应用与服务”竞赛样题
  • 排名好的手机网站建设电商软件平台开发
  • 万网网站建设万网网站建设建设银行钓鱼网站
  • 晨光文具网站建设策划书网站实时显示
  • 【Java高级编程】集合框架和泛型
  • 雅菲奥朗人工智能知识墙分享(二):『AI数据:人工智能时代的“数字燃料”——数据是AI的“第一生产力”』
  • 智能电网建设对就业市场有何影响?
  • 【08】C语言数据类型--字符类型
  • 张家界公司网站建设wordpress 新浪图片
  • 枣庄高端品牌网站建设案例微信上修改wordpress
  • 第十八讲(一) 三重积分
  • 怎么建设一个营销型网站博罗营销网站制作
  • 网站开发完整视频合肥网络推广有限公司
  • 第7章树和二叉树:二叉树遍历算法的应用
  • Marvell TX9190 Liquid-Cooled CPO Switch
  • 怎样做后端数据传输前端的网站asp汽车销售公司网站源码 4s店网站源码 汽车网站建设 完整无