当前位置：首页 > news >正文

深入剖析 Elasticsearch （ES）的近实时搜索原理

news 2025/9/13 5:22:09

在日常使用 Elasticsearch (ES) 时，我们常常会惊叹于它的速度：刚刚写入的数据，几乎瞬间就能被搜索到。这背后的功臣就是其近实时 (Near Real-Time, NRT) 搜索能力。

那么，ES 是如何在保证数据可靠性的前提下，实现如此高效的搜索的呢？这一切都围绕着 Refresh、Translog 和 Segment 这几个核心概念展开。

首先我们要明白，如果每一次数据写入都立刻触发磁盘 I/O 操作来更新倒排索引，那么频繁的磁盘读写将会成为巨大的性能瓶颈，系统吞吐量会急剧下降。这就像每写一个字就要保存一次整个文档，效率极低。

因此，ES 采用了一种经典的权衡策略：牺牲一点点“实时性”，换来巨大的性能提升。这个策略的核心就是 Refresh 操作。

在深入之前，我们需要理解两个基础概念：

倒排索引：ES 搜索快的根本。它通过内容（词条）反向找到包含它的文档 ID。
Lucene Segment：Lucene (ES 的底层库) 中的索引一旦生成就不可变。索引文件由多个 Segment 组成，每个 Segment 自身就是一个完整的、不可变的倒排索引。新的文档写入会生成新的 Segment，删除操作则是通过一个特殊的 .del 文件标记来实现。

不可变的好处：缓存友好、无需锁机制、可以常驻内存，极大提升了查询性能。

你发送一个命令，要求将一条新数据（例如一个商品信息）添加到名为 products 的索引中。

POST /products/_doc
{
"name": "iPhone 15",
"price": 5999,
"description": "一款强大的智能手机"
}

Elasticsearch 集群中的某个节点收到这个请求，它被称为“协调节点”。它根据文档的 ID（或自动生成的 ID）计算出这个文档应该被存储在哪个主分片上，并将请求转发给该主分片所在的“数据节点”。

数据节点收到文档后，会立即按顺序完成两个操作，这两个操作保证了数据不会丢失：

（1）写入 Translog（预写日志）

（2）存入内存缓冲区

至此，写入请求就可以返回成功响应给客户端了！ 客户端知道数据已经被ES接受并且不会丢失了。

这是一个后台定时任务，默认每隔 1 秒执行一次。它做了以下事情：

创建新分段：将内存缓冲区中所有新增或修改的文档，创建一个新的 Lucene 分段（Segment）。
存入文件缓存：这个新分段不会立即硬生生地写入磁盘（那很慢），而是先存放在操作系统的文件缓存（Page Cache） 中。这是一个位于内存和磁盘之间的高速区域。
使数据可读：重新打开索引器，让这个新的分段对搜索可见。

！！！里程碑事件！！！
经过这个 Refresh 操作后，之前写入的 "iPhone 15" 文档，虽然还没有真正持久化到物理磁盘上，但已经可以被搜索到了！

这就是“近实时”的由来： 从数据被接受到可被搜索，延迟约 1 秒（即 Refresh 的间隔）。

这是另一个后台任务，触发条件通常是：Translog 文件大小达到一定阈值 或 每隔30分钟。

执行一次 Refresh：首先确保内存缓冲区中所有数据都已经生成分段并可搜索。
持久化分段：将文件缓存中所有新生成的分段（不仅限于刚刚的那个）物理写入磁盘，真正实现数据持久化。
清空 Translog：因为数据已经安全落在磁盘上，就不再需要 Translog 中的这部分记录了，所以会截断（Trim）清空当前的 Translog 文件，并创建一个新的。

至此，数据走完了从接收到完全持久化的全过程，既安全又可查。