当前位置: 首页 > news >正文

kettle从入门到精通 第九十六课 ETL之kettle Elasticsearch 增删改查彻底掌握

场景:

 群里有小伙伴咨询kettle从Elasticsearch中抽取数据,群里老师们纷纷响应,vip小伙伴是不是有中受宠若惊的感觉。

今天我们使用kettle通过es的原生rest接口来进行操作es,开整。

前提:本篇文章基于elasticsearch:7.17.9版本进行测试,在 Elasticsearch 7.x 及以上版本中,_doc 不能自定义。在 Elasticsearch 6.x 及之前的版本中,一个索引里可以有多个文档类型(类似于 MySQL 中一个数据库里有多个表),文档类型可以自定义。

1、创建es索引

创建一个索引,名字为xiaojingang,如下所示

PUT http://127.0.0.1:9200/xiaojingang
{"settings": {"number_of_shards": 1,"number_of_replicas": 0}
}

 2、删除es索引

删除es索引xiaojingang,如下图所示:

DELETE http://127.0.0.1:9200/xiaojingang

 3、写入文档

POST http://localhost:9200/xiaojingang/_doc/1
{"name": "Java小金刚","content": "一个专门用来学习和交流kettle的公众号"
}

4、查询文档

GET http://localhost:9200/xiaojingang/_search
{"query": {"match": {"name": "小金刚"}}
}

5、更新文档 

POST http://localhost:9200/xiaojingang/_update/1
{"doc": {"name": "Java大金刚","content": "这是更新后的示例文章内容。"}
}

 重新读取

 6、删除文档

DELETE http://localhost:9200/xiaojingang/_doc/1

 重新读取

 7、分页读取,使用 Scroll API

Scroll API 适用于需要处理大量数据的场景,它通过创建一个快照来避免每次请求都进行排序和合并操作。

 请求示例:

# 初始化 scroll 请求
curl -X GET "localhost:9200/my_index/_search?scroll=1m" -H 'Content-Type: application/json' -d'
{"query": {"match_all": {}},"size": 10
}
'

上述请求中,scroll=1m 表示这个快照的有效期为 1 分钟,size=10 表示每次返回 10 个文档。响应中会包含一个 _scroll_id,用于后续的滚动请求。

# 后续的滚动请求
curl -X GET "localhost:9200/_search/scroll" -H 'Content-Type: application/json' -d'
{"scroll": "1m","scroll_id": "your_scroll_id"
}
'

相关文章:

  • excel 批量导出图片并指定命名
  • FPGA 纯逻辑NVME raid0 IP核
  • 常用设计模式在 Spring Boot 项目中的实战案例
  • 当当狸智能天文望远镜 TW2 | 用科技触摸星辰,让探索触手可及
  • 第十一节:图像处理基础-图像阈值处理
  • 16.Excel:打印技巧
  • ROS2: 服务通信
  • Android 数据持久化之数据库存储 Room 框架
  • RDD的处理过程
  • 远程桌面软件推荐
  • baobab查看磁盘空间占用
  • 使用node.js创建一个简单的服务器
  • LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B
  • 微软输入法常用快捷键介绍以及调教技巧
  • 【Hive入门】Hive数据导入与导出:批量操作与HDFS数据迁移完全指南
  • 设计模式之状态模式
  • 企业该如何选择合适的DDOS防护?
  • 交替序列长度的最大值
  • AI辅助DevOps与自动化测试:重构软件工程效率边界
  • 2025年数字藏品行业DDoS攻防指南:技术升级与合规防御双轨制
  • 快评|印巴为何停火?已达成“一场胜利,各自表述”的效果
  • 中国社科院:网文市场超430亿元,作者破3000万人
  • 海航回应“男团粉丝为追星堵住机舱通道”:已紧急阻止
  • 这座古村,藏着多少赣韵风华
  • 冯德莱恩:欧美贸易谈判前不会前往美国会见特朗普
  • 西安机场回应航站楼“水帘洞”事件:屋面排水系统被冰雹堵塞