当前位置：首页 > news >正文

KingbaseES读写分离集群架构解析

news 2025/9/15 5:44:47

一套为企业关键业务而生的数据库架构

在当今数字化转型的浪潮中，KingbaseES推出了基于WAL流复制技术的读写分离集群方案。据了解，这套架构通过JDBC驱动程序实现了智能化的读写分离——写操作交给主库处理，读操作则分散到备库执行，让数据库系统的响应速度和吞吐量都得到了显著提升。

整体架构图

两个"管家"守护着整个集群

KingbaseES的技术负责人介绍说，集群的稳定运行主要依靠两个核心进程来保障。

首先是repmgrd进程，它就像集群的"大管家"。在主节点上，它随时关注着本地数据库的健康状况；在备节点上，它不仅要看好自己家，还要时刻留意主库那边的动静。通过定期检查和sys_stat_replication视图，它能实时掌握数据同步的进展。一旦发现异常，立即启动应急预案。

其次是kbha进程，这是环境监控的"守护神"。它的主要职责是保护repmgrd进程正常运行，同时监控磁盘、网络等基础设施的状态。有意思的是，系统还通过crond服务来保护kbha自己，形成了"守护者的守护者"这样一个巧妙的设计。

KingbaseES集群管理架构

数据是如何在主备库之间"传递"的

KingbaseES数据同步架构

数据同步的过程其实并不复杂，主要分为三个步骤：

第一步，当主库接收到数据更新请求后，walwriter进程会把变更记录（也就是WAL日志）写入磁盘保存起来。

第二步，walsender进程读取这些WAL日志，通过网络流式传输给备库。这个过程就像快递员把包裹送到目的地一样。

第三步，备库的walreceiver进程接收到WAL日志后，先存储在本地，然后由startup进程重新执行这些操作，完成数据的同步更新。

企业可以根据需要选择不同的同步模式

技术人员表示，通过调整repmgr.conf配置文件中的synchronous参数，企业可以灵活选择适合自己业务特点的同步模式：

async模式：所有备库都采用异步复制，速度最快但存在数据丢失风险
sync模式：第一个连接的备库同步复制，其他作为候选，兼顾性能和安全
quorum模式：任意一个备库完成同步即可，在容错性和性能间找到平衡
all模式：所有备库必须同步完成，数据一致性最强但容错性较低
custom模式：允许用户自定义同步策略，灵活性最高

据介绍，生产环境通常推荐使用remote_apply级别的同步，这样能确保主备库之间的强一致性。当然，不同的业务场景需要在数据安全性和系统性能之间做出权衡。

当故障来临时，系统如何自救

一套完整的自动恢复体系

自探测、自修复的集群故障恢复技术

双层保护确保管理进程不掉线

为了确保高可用功能始终在线，系统采用了双层守护进程保护架构。kbha进程每3秒检查一次repmgrd的运行状态，发现异常立即重启；而系统的crontab则每分钟检查kbha进程，确保守护进程本身也不会失效。

主库故障后的四步切换流程

当主库发生故障时，备库的repmgrd进程会启动一套精心设计的四阶段切换流程：

第一阶段，先尝试重新连接主库。这是为了避免因为网络抖动造成的误判，毕竟"冤枉"一个正常运行的主库代价太大。

第二阶段，如果确认主库真的出问题了，系统会关闭所有备库的数据接收进程，让大家都"冷静"下来，确保状态一致。

第三阶段，多个备库开始"竞选"新主库。竞选的规则很明确：先看谁的数据最新（通过LSN比较），再看优先级设置，最后看节点ID。为了防止出现"脑裂"（两个主库同时存在），系统还会执行半数节点存活检查。

第四阶段，竞选成功的备库开始升级为主库。这个过程包括检查网络连通性、强制停止原主库（如果还在运行）、挂载VIP地址、执行promote命令升主，最后执行checkpoint确保数据持久化。

切换时间到底需要多久

切机时间构成公式

根据实际测试，故障切换的总时间由5个部分组成：监控检测延迟、故障确认时间、进程处理时间、网络检查时间和VIP切换时间。在最理想的情况下，切换可能只需要几秒钟；而在最坏的情况下，可能需要几分钟。影响切换时间的主要因素包括监控间隔设置、重连参数配置以及网络和VIP的切换速度。

故障节点如何重新加入集群

当一个故障的备库恢复后，主库的repmgrd进程会自动发现并启动恢复流程。整个过程分为7个步骤，从远程调用恢复命令开始，经过状态检查、数据同步（使用sys_rewind工具）、配置复制槽，最后重新启动并注册为备库。如果恢复失败，系统最多会重试3次。

智能的同异步转换机制

集群还具备一个很聪明的功能：根据实际情况自动在同步和异步模式间切换。当发现没有可用的流复制时，系统会自动转为异步模式，避免主库被阻塞；当流复制恢复且主备数据差异小于设定阈值（默认16M）时，又会自动切回同步模式，保证数据一致性。这个过程由主库的repmgrd进程每2秒检查一次，实现了高可用性和数据一致性的智能平衡。