当前位置: 首页 > wzjs >正文

网站建设的主要特征河西做网站的公司

网站建设的主要特征,河西做网站的公司,溧阳网站建设公司,wordpress用户前端发布在 Elasticsearch 中,聚合查询 的执行过程是 分布式 的,Elasticsearch 会先在每个分片(shard)上执行本地聚合,然后再在协调节点(coordinating node)上对所有分片的聚合结果进行 全局汇总。具体过…

在 Elasticsearch 中,聚合查询 的执行过程是 分布式 的,Elasticsearch 会先在每个分片(shard)上执行本地聚合,然后再在协调节点(coordinating node)上对所有分片的聚合结果进行 全局汇总。具体过程如下:


1. 聚合查询的执行过程

1.1 分片级别的本地聚合

  • 查询分发:当你在 Elasticsearch 中执行一个聚合查询时,协调节点会将查询分发到索引的每个分片(shard)上。

  • 本地聚合:每个分片会在本地对匹配的文档执行聚合操作(例如求和、平均值、分组等)。每个分片只会处理自己分片内的数据。

  • 返回中间结果:每个分片将本地的聚合结果返回给协调节点。

1.2 协调节点的全局汇总

  • 结果收集:协调节点会从所有分片中收集聚合结果。

  • 全局汇总:协调节点会对所有分片的聚合结果进行全局汇总。例如:

    • 如果是 求和(sum),协调节点会将所有分片的求和结果相加。

    • 如果是 平均值(avg),协调节点会计算所有分片的平均值。

    • 如果是 分组(terms),协调节点会合并所有分片的分组结果,并重新排序。

  • 返回最终结果:协调节点将最终的聚合结果返回给客户端。


2. 具体示例

假设你执行以下聚合查询:

json

复制

POST /your_index/_search
{"size": 0,"aggs": {"total_sales": {"sum": {"field": "sales"}}}
}

执行步骤

  1. 查询分发

    • 假设索引有3个分片(shard1, shard2, shard3)。

    • 协调节点将查询分发到 shard1、shard2 和 shard3。

  2. 本地聚合

    • shard1 计算本地的 sales 字段总和,假设结果为 1000。

    • shard2 计算本地的 sales 字段总和,假设结果为 1500。

    • shard3 计算本地的 sales 字段总和,假设结果为 2000。

  3. 全局汇总

    • 协调节点收集所有分片的聚合结果:1000(shard1) + 1500(shard2) + 2000(shard3)。

    • 协调节点计算全局总和:1000 + 1500 + 2000 = 4500。

  4. 返回结果

    • 协调节点将最终结果 4500 返回给客户端。


3. 关于 from 和 size 的影响

在聚合查询中,from 和 size 参数通常用于控制返回的 文档数量,而不是聚合结果的数量。例如:

json

复制

POST /your_index/_search
{"from": 0,"size": 10000,"aggs": {"total_sales": {"sum": {"field": "sales"}}}
}
  • from 和 size 的作用

    • from=0, size=10000 表示返回前10,000条文档。

    • 聚合操作是基于这10,000条文档进行的。

  • 执行过程

    • 每个分片会先根据 from 和 size 参数返回匹配的文档(最多10,000条)。

    • 然后在这些文档上执行本地聚合。

    • 协调节点会汇总所有分片的聚合结果。


4. 分片聚合 vs 全局聚合

  • 分片聚合:每个分片只处理自己分片内的数据,返回中间结果。

  • 全局聚合:协调节点对所有分片的中间结果进行汇总,返回最终结果。

注意事项

  1. 数据分布:聚合结果的准确性依赖于数据在分片中的分布。如果数据分布不均匀,可能会导致聚合结果不准确。

  2. 性能问题:如果聚合查询涉及大量数据,可能会导致协调节点的内存和 CPU 资源消耗过高。

  3. size 参数:在聚合查询中,size 参数通常用于控制返回的文档数量,而不是聚合结果的数量。如果需要控制聚合结果的数量,可以使用 terms 聚合的 size 参数。


5. 总结

  • 聚合查询的执行过程

    • 每个分片先执行本地聚合。

    • 协调节点对所有分片的聚合结果进行全局汇总。

  • from 和 size 的作用

    • 控制返回的文档数量,而不是聚合结果的数量。

  • 性能优化

    • 避免在聚合查询中使用过大的 from 和 size 参数。

    • 使用 composite 聚合或 bucket_sort 聚合对聚合结果进行分页。

通过理解 Elasticsearch 的分布式聚合机制,可以更好地优化查询性能,避免资源浪费。

http://www.dtcms.com/wzjs/828220.html

相关文章:

  • 北京企业做网站费用扬中零壹网站建设
  • php网站建设素材网站开发商外包
  • 淄博桓台学校网站建设方案如何搭建一个购物网站
  • 个人网站主页模板网站标题的设置方法
  • 湖南省百川电力建设有限公司网站一站式服务宣传语
  • 网站备案 地址一达通外贸综合服务平台
  • 想建立什么网站吗地方网 wordpress
  • 亚洲杯最新消息网站后端性能优化措施
  • 怎样让百度收录网站seo点击工具帮你火21星热情
  • 网站如何判断做的好不好网站集约化建设存在的困难
  • 网站开发程序员需要会的技能wordpress+悬浮按钮
  • 织梦网站面包屑导航怎么做电脑制作网页用什么软件
  • 幸运28网站代理怎么做做销售网站的公司哪家最好的
  • 建设网站的十个步骤小型网站建设
  • h5网站制作平台有哪些seo裤子的关键词首页排名有哪些
  • 视频网站代言人wordpress添加到主屏幕
  • 佛山做网站哪家公司最好网络广告策划的流程顺序为
  • 免费网站建设知识个人承接网站开发
  • 商丘网站优化mvc个人网站怎么做
  • 徐汇制作网站哪家好一流的营销型网站建设
  • 在国外做盗版网站吗wordpress 工具栏遮挡
  • 网站个人信息页面布局山东银汇建设集团网站
  • 洛阳做网站公司在哪nginx即代理又做网站
  • 学网站建设 去那里WordPress实现
  • 南昌的网站推广公司做网站ui
  • 公司网站建设概述省交通建设质安监督局网站
  • 温州网站推广优化公司专业酒店设计网站建设
  • 一个网站建设需要什么短视频拍摄策划方案
  • 怎样搭建微网站wordpress 获取随机文章
  • 正邦设计招聘使用 ahrefs 进行 seo 分析