当前位置：首页 > news >正文

Elasticsearch 滚动索引（Rollover Index）详解

news 2025/10/19 5:09:36

文章目录

1、滚动索引的作用
2、滚动索引的用法
- 2.1 核心概念
- 2.2 实现步骤
3、适用场景
4、与其他技术的结合使用
5、案例：日志数据的滚动索引
- 5.1 场景描述
- 5.2 实现步骤
6、示例：结合索引生命周期管理（ILM）
- 6.1 场景描述
- 6.2 实现步骤
7、总结

滚动索引（Rollover Index）是 Elasticsearch 中用于管理时间序列数据或日志数据的一种机制。它允许在索引达到一定条件（如文档数量、时间或大小）时自动创建新索引，从而避免单个索引过大，提高查询性能和管理效率。本文将详细介绍滚动索引的作用、用法、适用场景以及与其他技术的结合使用，并通过示例代码帮助理解。

1、滚动索引的作用

滚动索引的主要作用包括：

自动管理索引生命周期：根据预设条件（如时间、文档数量、索引大小）自动创建新索引。
优化查询性能：避免单个索引过大，提高查询效率。
简化数据管理：通过别名（Alias）统一访问多个索引，简化数据管理。
支持时间序列数据：适用于日志、监控数据等时间序列数据的存储和查询。

2、滚动索引的用法

2.1 核心概念

别名（Alias）：一个指向一个或多个索引的逻辑名称，用于统一访问。
滚动条件：触发创建新索引的条件，如文档数量、索引大小或时间。
写索引：当前正在写入的索引，通常通过别名指向。

2.2 实现步骤

创建初始索引：创建一个初始索引，并为其设置别名。
设置滚动条件：定义触发滚动的条件（如文档数量、索引大小或时间）。
执行滚动操作：当条件满足时，自动创建新索引并将别名指向新索引。

3、适用场景

滚动索引适用于以下场景：

日志数据：每天或每小时生成大量日志数据，需要按时间滚动索引。
监控数据：实时监控系统生成的时间序列数据，需要按大小或文档数量滚动索引。
时间序列数据：任何按时间顺序生成的数据，如传感器数据、交易记录等。

4、与其他技术的结合使用

滚动索引通常与以下技术结合使用：

索引生命周期管理（ILM）：自动管理索引的生命周期，包括滚动、删除、归档等操作。
别名（Alias）：通过别名统一访问多个索引，简化数据管理。
时间序列数据模型：适用于按时间顺序生成的数据。

5、案例：日志数据的滚动索引

5.1 场景描述

假设我们有一个日志系统，每天生成大量日志数据。我们希望每天自动创建一个新索引，并在索引达到 1000 个文档或 1GB 大小时滚动到新索引。

5.2 实现步骤

步骤 1：创建初始索引

首先创建一个初始索引，并为其设置别名 logs_write：

PUT /logs-000001
{
  "aliases": {
    "logs_write": {}
  }
}

步骤 2：设置滚动条件
定义滚动条件（如文档数量达到 1000 或索引大小达到 1GB）：

POST /logs_write/_rollover
{
  "conditions": {
    "max_docs": 1000,
    "max_size": "1gb"
  }
}

步骤 3：插入文档
向别名 logs_write 插入文档：

POST /logs_write/_doc
{
  "message": "This is a log entry",
  "timestamp": "2023-10-01T00:00:00Z"
}

步骤 4：滚动索引
当条件满足时，执行滚动操作，创建新索引并将别名指向新索引：

POST /logs_write/_rollover
{
  "conditions": {
    "max_docs": 1000,
    "max_size": "1gb"
  }
}

步骤 5：查询数据
通过别名 logs_write 查询数据：

GET /logs_write/_search
{
  "query": {
    "match_all": {}
  }
}

6、示例：结合索引生命周期管理（ILM）

6.1 场景描述

假设我们希望自动管理日志索引的生命周期，包括滚动、删除和归档操作。

6.2 实现步骤

步骤 1：创建生命周期策略
创建一个生命周期策略，定义滚动、删除和归档操作：

PUT _ilm/policy/logs_policy
{
  "policy": {
    "phases": {
      "hot": {
        "actions": {
          "rollover": {
            "max_size": "1gb",
            "max_docs": 1000
          }
        }
      },
      "delete": {
        "min_age": "30d",
        "actions": {
          "delete": {}
        }
      }
    }
  }
}

步骤 2：创建初始索引
创建一个初始索引，并应用生命周期策略：

PUT /logs-000001
{
  "settings": {
    "index.lifecycle.name": "logs_policy",
    "index.lifecycle.rollover_alias": "logs_write"
  },
  "aliases": {
    "logs_write": {}
  }
}

步骤 3：插入文档
向别名 logs_write 插入文档：

POST /logs_write/_doc
{
  "message": "This is a log entry",
  "timestamp": "2023-10-01T00:00:00Z"
}

步骤 4：自动滚动
当条件满足时，ILM 会自动执行滚动操作，创建新索引并将别名指向新索引。

7、总结

滚动索引是 Elasticsearch 中管理时间序列数据的重要机制。通过自动创建新索引，滚动索引可以优化查询性能、简化数据管理，并支持时间序列数据的存储和查询。结合索引生命周期管理（ILM）和别名（Alias），滚动索引能够实现更强大的数据管理功能，适用于日志、监控数据等场景。

查看全文

http://www.dtcms.com/a/74427.html

算法基础篇（蓝桥杯常考点）

ZED X系列双目3D相机的耐用性与创新设计解析

SpringCloud 学习笔记2（Nacos）

AMBA-CHI协议详解（二十三）

vue2：el-table列中文字前面加icon图标的两种方式

AI自动获客系统源码

【LangChain】理论及应用实战（5）：Agent

Linux 入门：权限的认识和学习

非常优秀的1个软件，再也不求人了！

DBA（数据库管理员）常用的 Linux 命令

Unity教程（二十二）技能系统分身技能

居家养老老年信息大数据分析基于SpringBootSSM框架

实现回车键自动登录功能：Vue 2 和 Vue 3 的解决方案

力扣No.673.最长递增子序列的个数

【css酷炫效果】实现鱼群游动动态效果

使用OBS进行webRTC推流参考

封装element-plus的组件暴露原生属性和方法

MultiPost--多平台博客发布工具

【大语言模型_5】xinference部署embedding模型和rerank模型

Hyperlane：Rust 语言打造的 Web 后端框架新标杆

MySQL意向锁我该怎么理解？

自然语言处理（2）—— NLP之百年风雨路

第七次作业，网络防御高级

适配iOS 18：检测并移除三方库中的 bitcode 部分

大数据学习（70）-大数据调度工具对比

Trae IDE 介绍与使用教程

大模型架构记录6-推荐算法

leetcode29. 两数相除-medium

TSB - AD 解读 — 迈向可靠、透明的 TSAD 任务

Power Apps 技术分享：画布应用使用表单控件