PostgreSQL 高可用实战:流复制主从集群(0 数据丢失 + 故障无缝切换)
“PG 主库突然宕机,我按 MySQL 主从的思路切从库,结果发现数据实时同步,0 丢失!切换完业务没感知,比 MySQL 半同步还稳!”
MySQL 老玩家对 “主从复制” 不陌生,但 PostgreSQL 的高可用核心 ——流复制,在数据一致性、实时性、容错性上更胜一筹:它能实现 “毫秒级同步”,支持同步复制 + 异步复制灵活切换,从库还能提供只读服务,堪称 “MySQL 半同步的加强版 Pro Max”。
这篇是 PostgreSQL 专栏的高可用实战篇,核心目标是帮 MySQL 老玩家 “无缝迁移” 到 PG 高可用方案:从流复制原理拆解,到主从集群搭建、故障切换测试,再到与 MySQL 主从的深度对比,每步都附可复现代码和状态验证,保证你看完能搭出 “0 数据丢失、故障秒切” 的 PG 主从集群。
一、先搞懂:PG 流复制到底强在哪?
MySQL 主从复制是 “主库写 binlog→从库 IO 线程拉取→SQL 线程执行”,中间有秒级延迟,异步模式还可能丢数据;而 PG 流复制是 “主库写 WAL 日志→从库实时拉取并应用”,相当于 “MySQL 半同步 + 并行复制的终极形态”。
用 “快递配送” 类比,一眼看清差距:
plaintext
【MySQL主从(异步)】
主库(商家):打包商品(写binlog)→ 扔快递站(等待从库拉取)→ 告诉买家“发货了”
从库(买家):隔几分钟去快递站取一次(IO线程轮询)→ 拆包用商品(SQL线程执行)
→ 延迟3-5秒,主库宕机可能丢件(binlog没拉取)【PG流复制(同步)】
主库(商家):打包商品(写WAL日志)→ 实时通知快递员(从库流复制进程)→ 快递员取件后当场确认→ 告诉买家“发货了”
从库(买家):收到快递立刻拆包用(实时应用WAL)
→ 延迟<100毫秒,主库宕机无丢件(从库已拿到所有WAL)
PG 流复制的 3 个核心优势(碾压 MySQL 主从)
- 数据一致性更强:支持 “同步流复制”(主库等待从库确认收到 WAL 才返回),真正 0 数据丢失;MySQL 半同步只是 “等待从库收到 binlog”,不保证已应用,极端情况仍可能丢数据;
- 从库实时可读:从库开启
hot_standby后,同步期间可正常执行查询(如报表、统计),MySQL 从库只读需单独配置,且延迟更高; - 容错性更好:主库宕机后,从库可直接提升为主库,无需像 MySQL 那样重新配置复制位置(PG 自动记录 WAL 位点)。
二、核心原理:PG 流复制的 “3 个关键组件”
MySQL 老玩家不用怕陌生,PG 的高可用组件和 MySQL 主从一一对应,只是名字不同,用表格快速对齐:
| PG 组件 / 概念 | 对应 MySQL 概念 | 作用(幽默解读) |
|---|---|---|
| WAL 日志(Write-Ahead Log) | binlog 日志 | 主库的 “操作账本”,记录所有数据变更,先写日志再写数据 |
| 流复制进程(walreceiver/sender) | IO 线程 / Binlog Dump 线程 | 主库 sender 推 WAL,从库 walreceiver 拉 WAL,实时同步 |
| 复制用户 | 复制用户(如 repl) | 从库连接主库的专用账号,仅需复制权限 |
| hot_standby | 从库只读模式 | 从库同步时可提供查询 |
