当前位置: 首页 > news >正文

Elasticsearch 索引副本数

作者:来自 Elastic Kofi Bartlett

解释如何配置 number_of_replicas、它的影响以及最佳实践。

更多阅读:Elasticsearch 中的一些重要概念: cluster, node, index, document, shards 及 replica

想获得 Elastic 认证?查看下一期 Elasticsearch 工程师培训什么时候开始!

Elasticsearch 拥有大量新功能,能帮助你为你的使用场景构建最佳搜索解决方案。深入了解我们的示例笔记本,开始免费云试用,或立即在本地机器上尝试 Elastic。


Elasticsearch 被设计为一个分布式系统,能够处理大量数据并提供高可用性。其中一个关键特性是索引副本的概念,它由 number_of_replicas 设置控制。本文将深入探讨这个设置的细节、其影响以及如何正确配置它。

副本在 Elasticsearch 中的作用

在 Elasticsearch 中,索引是一组文档的集合,这些文档被划分到多个主分片中。每个主分片是一个独立的 Apache Lucene 索引,索引中的文档被分布在所有主分片之间。为了确保高可用性和数据冗余,Elasticsearch 允许每个分片有一个或多个副本,称为副本分片。

number_of_replicas 设置控制 Elasticsearch 为索引中的每个主分片创建多少个副本分片(副本)。默认情况下,Elasticsearch 为每个主分片创建一个副本,但可以根据系统的需求进行更改。

配置 number_of_replicas

number_of_replicas 设置可以在创建索引时配置,也可以在之后更新。以下是在创建索引时设置的方法:

PUT /my_index
{"settings": {"number_of_replicas": 2}
}

在这个例子中,Elasticsearch 会为 my_index 索引中的每个主分片创建两个副本。

要更新已存在索引的 number_of_replicas 设置,可以使用 _settings API:

这个命令会将 my_index 索引更新为每个主分片有三个副本。

number_of_replicas 设置的影响

number_of_replicas 设置对 Elasticsearch 集群的性能和弹性有重大影响。以下是一些关键点需要考虑:

  1. 数据冗余和可用性:增加 number_of_replicas 通过为每个分片创建更多副本来提高数据的可用性。如果某个节点发生故障,Elasticsearch 仍然可以从剩余节点上的副本分片提供数据。
  2. 搜索性能:副本分片可以处理读取请求,因此拥有更多副本可以通过在更多分片之间分配负载来提升搜索性能。
  3. 写入性能:但每次写入操作都必须在每个分片副本上执行。因此,较高的 number_of_replicas 会因为需要执行更多写操作而降低索引性能。
  4. 存储需求:更多副本意味着更多的存储空间。你需要确保集群有足够的容量来存储额外的副本。
  5. 对节点故障的抗性number_of_replicas 应该根据集群中的节点数量来设置。如果副本数量大于等于节点数量,集群可以在多个节点故障的情况下仍然不丢失数据。

设置 number_of_replicas 的最佳实践

最优的 number_of_replicas 设置取决于你系统的具体需求。但以下是一些通用的最佳实践:

  • 对于单节点集群,number_of_replicas 应设置为 0,因为没有其他节点来存储副本。

  • 对于多节点集群,number_of_replicas 应至少设置为 1,以确保数据冗余和高可用性。

  • 如果搜索性能是优先考虑的目标,可以考虑增加 number_of_replicas。但要注意与写入性能和存储需求之间的权衡。

  • 始终确保你的集群有足够的容量来存储额外的副本。

更多阅读:

  • Elasticsearch:增加 Elasticsearch 写入吞吐量和速度的完整指南

  • Elasticsearch:如何提高 Elasticsearch 数据摄入速度

  • Elasticsearch:提升 Elasticsearch 性能

原文:Elasticsearch Index Number_of_Replicas - Elasticsearch Labs

相关文章:

  • Git基础使用方法与命令总结
  • Python线性回归:从理论到实践的完整指南
  • 【时空图神经网络 交通】相关模型2:STSGCN | 时空同步图卷积网络 | 空间相关性,时间相关性,空间-时间异质性
  • vue复杂数据类型多层嵌套的监听
  • DDS(数据分发服务) 和 P2P(点对点网络) 的详细对比
  • Qwen2.5-VL模型sft微调和使用vllm部署
  • yocto项目例子
  • 美创科技针对《银行保险机构数据安全管理办法》解读
  • 武汉火影数字全息剧秀制作:科技与艺术的梦幻联动
  • RAG数据处理:PDF/HTML
  • OpenCV CUDA模块中矩阵操作------降维操作
  • 22、能源监控与优化 - 数据中心模拟 - /能源管理组件/data-center-energy-monitoring
  • OCCT知识笔记之OCAF框架详解
  • CVE-2017-8046 漏洞深度分析
  • 【学习笔记】机器学习(Machine Learning) | 第七章|神经网络(1)
  • C语言水仙花数
  • 多通道电源管理芯片在分布式能源系统中的优化策略
  • 敏捷-第二章 敏捷宣言与原则
  • AI神经网络降噪算法在语音通话产品中的应用优势与前景分析
  • 我用 Appuploader绕过 Mac,成功把 iOS 应用上线了 App Store
  • 戛纳打破“疑罪从无”惯例,一法国男演员被拒之门外
  • 四川内江警方通报一起持刀伤人致死案:因车辆停放引起,嫌犯被抓获
  • 圆桌丨新能源车超充技术元年,专家呼吁重视电网承载能力可能面临的结构性挑战
  • 王征、解宁元、牛恺任西安市副市长
  • 牛市早报|中方调整对美加征关税措施,五部门约谈外卖平台企业
  • 国务院关税税则委员会公布公告调整对原产于美国的进口商品加征关税措施