当前位置: 首页 > news >正文

探索数据的力量:Elasticsearch中指定链表字段的统计查询记录

目录

一、基本的数据结构说明

二、基本的统计记录

(一)统计当前索引中sellingProducts的所有类型

(二)检索指定文档中sellingProducts的数据总量

(三)检索指定文档中sellingProducts指定类型的数量统计

(四)统计所有文档中sellingProducts中所有元素的总数

(五)统计所有文档中sellingProducts中详细分类总数统计

三、总结


干货分享,感谢您的阅读!

在当今数据驱动的时代,企业和组织面临着海量数据的挑战,如何有效地提取和分析这些数据已成为关键问题。Elasticsearch作为一种强大的搜索和分析引擎,提供了灵活而高效的数据检索能力,能够帮助我们快速获取所需信息。本篇文章将深入探讨在Elasticsearch中对sellingProducts字段的统计操作。

通过具体的案例和查询示例,我们将展示如何从sell_product_order索引中提取出关键信息,包括产品类型的统计、产品数量的计算以及更复杂的聚合查询。无论是想要了解产品销售状况的市场分析师,还是希望提升数据处理能力的开发者,本文都将为你提供实用的参考和技术支持。

在接下来的部分中,我们将逐步介绍基本的数据结构、关键的统计操作以及相应的Elasticsearch查询语法,帮助读者掌握在实际应用中如何进行数据统计和分析。通过这次学习,我们希望读者能够更加熟悉Elasticsearch的使用,并在实际工作中充分利用这一强大的工具,挖掘出数据背后的价值。

一、基本的数据结构说明

对应ES索引:sell_product_order

针对假设ES文档的基本结构内容如下:

   {"id": "2024041801000115936701","sellingProducts": ["FUND_20150718000230030000000000002549","STOCK_656","STOCK_4055","STOCK_1720","FUND_20180920000230030000000000015303"]}

我们针对里面的sellingProducts字段进行一些基本的统计操作,本次记录一下相关的基本操作。

二、基本的统计记录

(一)统计当前索引中sellingProducts的所有类型

sell_product_order 索引中检索数据,然后根据 sellingProducts 字段中的内容,聚合出售产品的类型信息,并返回前 10 个最频繁出现的产品类型。

GET /sell_product_order/_search
{"size": 0,"aggs": {"types": {"terms": {"script": {"source": """HashSet types = new HashSet();for (item in doc['sellingProducts']) {int delimiterIndex = item.indexOf('_');if (delimiterIndex > -1) {types.add(item.substring(0, delimiterIndex));}}return types;""","lang": "painless"},"size": 10 }}}
}

(二)检索指定文档中sellingProducts的数据总量

从索引为 sell_product_order 中检索数据,并返回指定 _id 的文档,并在结果中包含一个名为 sellingProducts_count 的脚本字段,用于计算每个文档中 sellingProducts 字段的大小。

GET /sell_product_order/_search
{"query": {"terms": {"_id": ["2024041801000115936701"  ]}},"script_fields": {"sellingProducts_count": {"script": {"lang": "painless","source": "doc['sellingProducts'].size()" }}}
}

(三)检索指定文档中sellingProducts指定类型的数量统计

sell_product_order 索引中检索具有指定 _id 的文档,并在结果中返回两个计算字段,分别是 fund_countstock_count,它们分别表示文档中以 'FUND_''STOCK_' 开头的元素的数量。

GET /sell_product_order/_search
{"query": {"terms": {"_id": ["2024041801000115936701"]}},"script_fields": {"fund_count": {"script": {"lang": "painless","source": "int fundCount = 0; for (String item : doc['sellingProducts']) { if (item.startsWith('FUND_')) { fundCount++; } } return fundCount;"}},"stock_count": {"script": {"lang": "painless","source": "int stockCount = 0; for (String item : doc['sellingProducts']) { if (item.startsWith('STOCK_')) { stockCount++; } } return stockCount;"}}}
}

(四)统计所有文档中sellingProducts中所有元素的总数

sell_product_order 索引中检索所有文档,并计算 sellingProducts 字段中所有元素的总数,将结果作为 total_sellingProducts_items 的值返回。

GET /sell_product_order/_search
{"size": 0,  "aggs": {"total_sellingProducts_items": {"sum": {"script": {"source": "doc['sellingProducts'].size()","lang": "painless"}}}}
}

(五)统计所有文档中sellingProducts中详细分类总数统计

计算 sellingProducts 字段中以 FUND_ 开头和以 STOCK_ 开头的元素数量,将结果以 fund_countstock_count 的形式返回。

GET /sell_product_order/_search
{"size": 0,"aggs": {"totals": {"scripted_metric": {"init_script": "state.fund_count = 0; state.stock_count = 0;","map_script": """if (doc.containsKey('sellingProducts')) {for (def item : doc['sellingProducts']) {if (item.startsWith('FUND_')) {state.fund_count++;} if (item.startsWith('STOCK_')) {state.stock_count++;}}}""","combine_script": "return state","reduce_script": """def total_fund_count = 0;def total_stock_count = 0;for (state in states) {total_fund_count += state.fund_count;total_stock_count += state.stock_count;}return ['fund_count': total_fund_count, 'stock_count': total_stock_count];
"""}}}
}

三、总结

在本文中,我们探讨了如何在Elasticsearch中对sell_product_order索引中的sellingProducts字段进行基本的统计操作。通过具体的查询示例,我们展示了多种数据检索和聚合的技巧,帮助我们从海量数据中提取出有价值的信息。

首先,我们介绍了数据结构的基本概念,明确了如何定位目标字段。随后,我们演示了几种不同的统计方法,包括计算产品类型的出现频率、检索指定文档中产品数量、以及对产品类型进行细分统计。这些操作不仅为数据分析提供了基础支持,也为业务决策提供了有力的数据依据。

通过这些示例,读者可以看到Elasticsearch的强大灵活性,以及它在处理复杂数据查询时的高效性。这些技巧不仅适用于特定的业务场景,也为进一步的深入分析和数据挖掘奠定了基础。

在未来的应用中,我们鼓励读者继续探索Elasticsearch的更多功能,如更高级的聚合分析和数据可视化工具,以全面提升数据处理能力和决策支持效果。通过不断实践和学习,大家将能更好地掌握这一工具,从而在日益复杂的数据环境中游刃有余。

相关文章:

  • 生日悖论理论及在哈希函数碰撞中的应用
  • AndroidMJ-mvp与mvvm
  • ASR语音转写技术全景解析:从原理到实战
  • 人工智能学习21-Pandas-pivot_table
  • 关于MCU、MPU、SoC、DSP四大类型芯片
  • 基于区块链的去中心化身份验证系统:原理、实现与应用
  • 【软测】接口测试 - 用postman测试软件登录模块
  • GDI+ 中与GDI32取图形区域函数对比CreateEllipticRgn/CreatePolygonRgn
  • day31 打卡
  • 茶文化部分答案
  • 数据库学习(六)——MySQL事务
  • Linux文件权限管理核心要点总结
  • 【图片转 3D 模型】北大·字节跳动·CMU携手——单图15 秒生成结构化3D模型!
  • 精准测量 MySQL 主从复制延迟—pt-heartbeat工具工作原理
  • 8088单板机8259中断的软件触发测试
  • Python全栈开发:前后端分离项目架构详解
  • 如何让 VS Code 仅通过滚轮放大字体,而不缩放整个界面?
  • 人工智能学习15-Numpy-花式索引和索引技巧
  • 齐次变换矩阵相乘的复合变换:左乘与右乘的深度解析
  • 思科交换机远程登录配置
  • 男女之间做那种事情视频网站/推广平台排名前十名
  • 网站平台建设服务承诺书/关键词优化app
  • 上海seo网站建设/竞价托管是啥意思
  • 十堰市茅箭区建设局网站/上海seo优化公司kinglink
  • 广西南宁最新新闻事件/seo外包网络公司
  • 做.net网站流程/深圳网站制作