当前位置: 首页 > news >正文

【Elasticsearch】`nested`和`flattened`字段在索引时有显著的区别

有同学问,nested查询效率不高为啥不直接扁平化查询呢?就跟之前的普通结构查询一样,这就有些想当然了,因为扁平化的结构在存储时,其实跟我们想的不一样,接下来给出扁平化在索引时的存储结构(尤其是当嵌套对象为数组时)

 

在 Elasticsearch 中,`nested`和`flattened`字段在索引时有显著的区别,这些区别主要体现在数据的存储方式、查询能力和性能上。以下是详细的对比:

---

1.数据存储方式

`nested`字段

• 存储方式:`nested`字段将数组中的每个对象作为独立的隐藏文档进行索引。每个嵌套对象可以独立于其他对象进行查询。

• 示例:

```json

  PUT my-index

  {

    "mappings": {

      "properties": {

        "comments": {

          "type": "nested",

          "properties": {

            "author": { "type": "text" },

            "content": { "type": "text" }

          }

        }

      }

    }

  }

 

  PUT my-index/_doc/1

  {

    "comments": [

      { "author": "Alice", "content": "Great post!" },

      { "author": "Bob", "content": "Very useful." }

    ]

  }

  ```

在内部,Elasticsearch 会将每个`comments`对象索引为独立的隐藏文档,类似于:

```json

  {

    "comments.author": ["Alice", "Bob"],

    "comments.content": ["Great post!", "Very useful."]

  }[
  {
    "author": "Alice",
    "content": "Great post!"
  },
  {
    "author": "Bob",
    "content": "Very useful."
  }
]

  ```

`flattened`字段

• 存储方式:`flattened`字段将整个对象扁平化为一个单一字段,所有键值对都被存储在一个字段中。这种方式适合简单的键值对数据,但不适合复杂的数据结构。

• 示例:

```json

  PUT my-index

  {

    "mappings": {

      "properties": {

        "comments": {

          "type": "flattened"

        }

      }

    }

  }

 

  PUT my-index/_doc/1

  {

    "comments": [

      { "author": "Alice", "content": "Great post!" },

      { "author": "Bob", "content": "Very useful." }

    ]

  }

  ```

在内部,Elasticsearch 会将`comments`扁平化为:

```json

  {

    "comments.author": ["Alice", "Bob"],

    "comments.content": ["Great post!", "Very useful."]

  }

  ```

2.查询能力

`nested`字段

• 查询方式:使用`nested`查询,可以独立查询数组中的每个对象。

• 示例:

```json

  GET my-index/_search

  {

    "query": {

      "nested": {

        "path": "comments",

        "query": {

          "bool": {

            "must": [

              { "match": { "comments.author": "Alice" }},

              { "match": { "comments.content": "Great post!" }}

            ]

          }

        }

      }

    }

  }

  ```

这个查询会匹配`author`为`Alice`且`content`为`Great post!`的评论。

`flattened`字段

• 查询方式:使用普通查询,但无法独立查询数组中的每个对象。

• 示例:

```json

  GET my-index/_search

  {

    "query": {

      "bool": {

        "must": [

          { "match": { "comments.author": "Alice" }},

          { "match": { "comments.content": "Great post!" }}

        ]

      }

    }

  }

  ```

这个查询会匹配包含`author`为`Alice`和`content`为`Great post!`的文档,但无法保证它们属于同一个评论对象。

3.性能

`nested`字段

• 性能:`nested`字段的查询性能通常比普通字段慢,因为每个嵌套对象都被索引为独立的隐藏文档。查询时需要额外的处理来匹配嵌套对象。

• 适用场景:适用于需要独立查询数组中的每个对象的场景。

`flattened`字段

• 性能:`flattened`字段的查询性能通常比`nested`字段高,因为数据结构更简单,索引和查询更高效。

• 适用场景:适用于简单的键值对数据,不需要复杂的查询。

4.总结

• `nested`字段:

• 优点:支持复杂的查询,可以独立查询数组中的每个对象。

• 缺点:查询性能较低,索引和查询更复杂。

• 适用场景:需要独立查询数组中的每个对象,或需要支持复杂的嵌套查询。

• `flattened`字段:

• 优点:查询性能高,索引和查询更简单。

• 缺点:不支持复杂的查询,无法独立查询数组中的每个对象。

• 适用场景:简单的键值对数据,不需要复杂的查询。

---

5.是否可以在索引时选择使用`nested`或`flattened`?

在索引时,你可以根据需求选择使用`nested`或`flattened`字段,但它们的存储方式和查询能力有显著区别。以下是选择的建议:

• 如果需要独立查询数组中的每个对象,或者需要支持复杂的嵌套查询,应使用`nested`字段。

• 如果数据结构简单,不需要复杂的查询,且需要更高的性能,应使用`flattened`字段。

总之,选择哪种字段类型取决于你的具体需求和数据结构。

 

相关文章:

  • 泛娱乐行业技术突围:AWS云服务如何重塑数字娱乐新生态?
  • Pandas:从一个DataFrame中直接索引赋值到另一个索引位置出错的Bug及其解决方案
  • 定时器——时基
  • 谈谈 wait 和 notify
  • Web项目测试专题(七)安全性测试
  • AI前端开发赋能自主创业:ScriptEcho助你乘风破浪
  • 前端布局的方式有哪些
  • Qt 中使用 ffmpeg 获取采集卡数据录制视频
  • K8s 证书认知(K8s Certificate Awareness)
  • 洛谷P8707 [蓝桥杯 2020 省 AB1] 走方格
  • HBuilderX中uni-app打开页面时,如何用URL传递参数,Query参数传递
  • Java 与设计模式(15):模板方法模式
  • 前端如何实现一个五星评价,鼠标滑动,前边星星颜色的变黄,后边的不变;
  • java后端开发day16--字符串(二)
  • 25/2/17 <嵌入式笔记> 桌宠代码解析
  • VisionMaster4.4 python脚本 图像处理 转换函数 爱之初体验
  • recent移除task时,结束其所有进程和service(全Android版本)
  • 日常开发中,使用JSON.stringify来实现深拷贝的坑
  • PHP支付宝--转账到支付宝账户
  • 计算机专业知识【探秘 C/S 工作模式:原理、应用与网络协议案例】
  • “把历史视角、战略思维,都落实到具体行动上来”——习近平总书记河南考察纪实
  • 吴玉凤获任杭州市政协副秘书长,此前担任富阳区委书记
  • 35款移动应用存在违法违规收集使用个人信息情况,涉及智谱清言、Kimi等
  • 港股上市首日大涨,宁德时代“新动力”何在?曾毓群详谈零碳科技布局
  • 英伟达推出新技术加速AI芯片连接,期望构建互联互通生态
  • 这个死亡率第一的“老年病”,正悄悄逼近年轻人