当前位置: 首页 > news >正文

ES批量查询

在 Elasticsearch 中,multi_search(也称为 msearch)是一种允许你在单个请求中执行多个搜索操作的 API。它可以显著减少网络开销,尤其是在需要执行多个查询时。multi_search 会将多个查询打包成一个请求发送给 Elasticsearch,然后返回多个查询的结果。


1. multi_search 的基本用法

multi_search 的请求格式如下:

  1. 请求头:指定索引名称(可选)和搜索参数。

  2. 请求体:每个查询由两部分组成:

    • 一个可选的 header 部分,用于指定索引、类型和搜索参数。

    • 一个 body 部分,用于指定查询 DSL。

示例

以下是一个 multi_search 的示例,包含两个查询:

json

复制

POST /_msearch
{}
{"index": "index1"}
{"query": {"match_all": {}}, "size": 10}
{}
{"index": "index2"}
{"query": {"match": {"field": "value"}}, "size": 5}
  • 第一个查询:在 index1 中执行 match_all 查询,返回最多10条文档。

  • 第二个查询:在 index2 中执行 match 查询,返回最多5条文档。


2. multi_search 的响应

multi_search 的响应是一个数组,数组中的每个元素对应一个查询的结果。例如:

json

复制

{
  "responses": [
    {
      "took": 10,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 100,
          "relation": "eq"
        },
        "max_score": 1.0,
        "hits": [
          {
            "_index": "index1",
            "_type": "_doc",
            "_id": "1",
            "_score": 1.0,
            "_source": {
              "field": "value1"
            }
          },
          ...
        ]
      }
    },
    {
      "took": 5,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 50,
          "relation": "eq"
        },
        "max_score": 1.5,
        "hits": [
          {
            "_index": "index2",
            "_type": "_doc",
            "_id": "2",
            "_score": 1.5,
            "_source": {
              "field": "value2"
            }
          },
          ...
        ]
      }
    }
  ]
}
  • responses:是一个数组,每个元素对应一个查询的结果。

  • 每个查询的结果与普通的 _search 请求返回的结果格式相同。


3. multi_search 的优势

  1. 减少网络开销

    • 将多个查询打包成一个请求,减少了客户端与 Elasticsearch 之间的网络往返次数。

    • 适合需要同时执行多个查询的场景。

  2. 提高性能

    • Elasticsearch 会并行处理 multi_search 中的查询,从而提高查询效率。

  3. 灵活性

    • 可以在一个请求中查询多个索引,甚至可以为每个查询指定不同的索引和参数。


4. multi_search 的使用场景

  1. 批量查询

    • 当需要同时执行多个查询时,可以使用 multi_search 来减少网络开销。

    • 例如,在前端页面中同时加载多个模块的数据。

  2. 多索引查询

    • 当需要从多个索引中查询数据时,可以使用 multi_search 来简化查询逻辑。

  3. 性能优化

    • 当需要优化查询性能时,可以将多个查询合并为一个 multi_search 请求。


5. 示例代码

以下是一个完整的 multi_search 示例,包含两个查询:

请求

json

复制

POST /_msearch
{}
{"index": "index1"}
{"query": {"match_all": {}}, "size": 10}
{}
{"index": "index2"}
{"query": {"match": {"field": "value"}}, "size": 5}

响应

json

复制

{
  "responses": [
    {
      "took": 10,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 100,
          "relation": "eq"
        },
        "max_score": 1.0,
        "hits": [
          {
            "_index": "index1",
            "_type": "_doc",
            "_id": "1",
            "_score": 1.0,
            "_source": {
              "field": "value1"
            }
          },
          ...
        ]
      }
    },
    {
      "took": 5,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 50,
          "relation": "eq"
        },
        "max_score": 1.5,
        "hits": [
          {
            "_index": "index2",
            "_type": "_doc",
            "_id": "2",
            "_score": 1.5,
            "_source": {
              "field": "value2"
            }
          },
          ...
        ]
      }
    }
  ]
}

6. 总结

  • multi_search 是一种高效的批量查询机制,适合同时执行多个查询。

  • 优势:减少网络开销、提高性能、支持多索引查询。

  • 使用场景:批量查询、多索引查询、性能优化。

通过合理使用 multi_search,可以显著提高查询效率,尤其是在需要执行多个查询的场景中。

相关文章:

  • 网络分层 DNS CDN简单概念梳理
  • vcpkg 与 CMake 集成的步骤
  • 从零搭建微服务项目Pro(第1-3章——Quartz定时任务模块整合)
  • Perl 调用 DeepSeek API 脚本
  • 云原生监控篇——全链路可观测性与AIOps实战
  • 安装即是高级版!专业版软件,
  • Hadoop之01:HDFS分布式文件系统
  • Xshell及Xftp v8.0安装与使用-生信工具050
  • 【AI学习从零至壹】pytorch基础
  • Linux安装Apache2.4.54操作步骤
  • 前端js搭建(搭建后包含cookie,弹窗,禁用f12)
  • onerror事件的理解与用法
  • 【人工智能】GPT-4 vs DeepSeek-R1:谁主导了2025年的AI技术竞争?
  • 对大模型输出的 logits 进行处理,从而控制文本的生成
  • Java---入门基础篇(下)---方法与数组
  • C++类和对象:匿名对象及连续构造拷贝编译器的优化
  • Windows下git疑难:有文件无法被跟踪
  • FPGA开发,使用Deepseek V3还是R1(1):应用场景
  • openssl下aes128算法CFB模式加解密运算实例
  • 【自学笔记】大数据基础知识点总览-持续更新
  • 高大上公司网站/百度官方客户端
  • 多语言企业网站源码/10常用的网络营销方法
  • 北京著名网站建设公司/昆明装饰企业网络推广
  • 建筑公司网站 新闻/关键洞察力
  • 一级建设造师网站/网盘搜索
  • wordpress页面关键词和描述/seo的优点