当前位置: 首页 > news >正文

Elasticsearch:6.x 处理一对多关系使用场景

如何查询博客作者姓名中带“旺”字、博客标题中带“运”的10篇博客列表
一、 应用层做联接
建立两个索引,先从博客作者中查询出符合姓名中带“旺”字的作者ID,
然后根据这些ID、博客标题中带“运”字这两个条件查询出来博客列表
优点: 数据很规范清晰,作者一个索引,博客一个索引
缺点: 如果查询出来的作者ID很多的情况造成效率很低(如果有10万作者的话,每一次分页都需要先查作者,再拿作者ID为条件)
二、非规范化的数据
同一个索引中,博客作者和博客发布表整合成一个文档
冗余、冗余、冗余
优点:不需要做联接
缺点:由于作者博客为一对多关系,每次修改了作者姓名,都需要更新所有的索引文档数据,每次都需要批量改
三、嵌套对象
博客作者和博客发布存在于一个文档(nested)
索引映射中,所有的博客作为数组嵌套的类型存在
优点:不需联接
缺点:只能返回符合条件的整个文档,不能部分返回嵌套文档中的数据(nested查询职能返回最顶层的文档)
四、父-子关系文档
博客作者和博客发布存在于一个文档(join)
映射时将其中一个字段作为连接字段,供作关联关系
优点:能返回想要的数据
缺点:性能差一点
使用父子文档的模式有一些需要特别关注的点:
1、每一个索引只能定义一个 join field
2、父子文档必须在同一个分片上,意味着查询,更新操作都需要加上 routing 可以向一个已经存在的join field上新增关系
总的来说,嵌套对象通过冗余数据来提高查询性能,适用于读多写少的场景。父子文档类似关系型数据库中的关联关系,适用于写多的场景,减少了文档修改的范围。
1、普通子对象模式实现一对多关系,会损失子对象的边界,子对象的属性之前关联性丧失。
2、嵌套对象可以解决普通子对象存在的问题,但是它有两个缺点,一个是更新主文档的时          候要全部更新,另外就是不支持子文档从属多个主文档的场景。
3、父子文档能解决前面两个存在的问题,但是它适用于写多读少的场景。
4、有了这样的粗略认知之后,实现开始提到的使用场景,选择第四种方案{父-子关系文            档}, 并在做了一个简单类似的实验
 1、创建索引及映射关系
put bnb_home

{
  "mappings": {
    "home_search": {
      "properties": {
        "shop_room": {
          "type": "join",
          "relations": {
            "shop": "room"
          }
        }
      }
    }
  }
}
2、添加父文档(酒店信息)
PUT bnb_home/home_search/1?refresh

{
  "data": {"shopId":1, "shopName": "我是客栈锅手", "description": "我是一条测试数据"},
  "shop_room": {
    "name": "shop"
  }
}
3、添加子文档(酒店房间信息)***划重点:URL中的routing必须是parent ID 的值
PUT bnb_home/home_search/2?routing=1&refresh

{
  "data": {"shopId":1, "roomId":1, "roomName": "我是一条小虫子", "description": "可爱清新风格"},
  "shop_room": {
    "name": "room",
    "parent": "1"
  }
}
4、再添加子文档(酒店房间信息)
PUT bnb_home/home_search/3?routing=1&refresh

{
  "data": {"shopId":1, "roomId":2, "roomName": "我是第二间房子", "description": "第二件仿佛回到开始"},
  "shop_room": {
    "name": "room",
    "parent": "1"
  }
}
5、查询酒店(查询店铺名称中带”你好“,房间名称带有“小虫”的{店铺})
POST bnb_home/_search

{
    "query": {
      "bool":{
        "must":[
          {"match":{"data.shopName":"客栈"}},
          {
              "has_child" : {
                  "type" : "room",
                  "query" : {
                    "bool":{
                      "must":[
                        {"match":{"data.roomName":"小虫子"}}
                      ]
                    }
                  }
              }
          }
        ]
      }
    }
}
6、查询酒店房间(查询店铺名称中带”你好“,房间名称带有“小虫”的{房间})
POST bnb_home/_search

{
    "query": {
      "bool":{
        "must":[
          {"match":{"data.roomName":"小虫"}},
          {
              "has_parent" : {
                  "parent_type" : "shop",
                  "query" : {
                    "bool":{
                      "must":[
                          {"match":{"data.shopName":"客栈"}}
                      ]
                    }
                  }
              }
          }
        ]
      }
    }
}

以上是6.x未使用相关API,抄摘网上创建、添加、查询。在实际操作中我们可以直接导入Es - JavaAPI直接调用API不使用ES工具提交JSON请求【JSON书写过程中很容易出现错误,我们可以使用JSON效验工具】。

相关文章:

  • LLM的基础模型5:Embedding模型
  • Java物业管理系统+数据库应用程序开发[JavaSE+JDBC+idea控制台+MySQL]
  • 使用 Django 连接 MySQL 数据库
  • 业务安全蓝军测评标准解读—业务安全体系化
  • Java18新特性有哪些
  • 基于EasyX的贪吃蛇小游戏 - C语言
  • kafka-消费者服务搭建配置简单消费(SpringBoot整合Kafka)
  • Linux命令
  • 阻性负载和感性负载的区别
  • C++模板类与Java泛型类的实战应用及对比分析
  • Java实现线程安全的单例模式
  • Redis单线程
  • Python 实现乘数加密法
  • 四川汇聚荣聚荣科技有限公司综合实力怎么样?
  • Docker - Kafka
  • 【动手学深度学习】卷积神经网络CNN的研究详情
  • 【C语言】结构体(及位段)
  • 多元化征信产品体系:金融创新的驱动力与实体经济的助推器
  • pycharm链接auto al服务器
  • APP ID 和 APP Key
  • 泉州一家婚介机构广告牌越南新娘七天闪婚领证?市监部门介入
  • 上海充电桩调研:须全盘考量、分步实现车网互动规模化
  • 李公明︱一周书记:浪漫主义为什么……仍然重要?
  • 人民日报钟声:中方维护自身发展利益的决心不会改变
  • 习近平向“和平薪火 时代新章——纪念中国人民抗日战争和苏联伟大卫国战争胜利80周年中俄人文交流活动”致贺信
  • 从“重规模”向“重回报”转变,公募基金迎系统性改革