Debezium导致线上PostgreSQL数据库磁盘日志飙升处理方案
1. 问题现象
PostgreSQL数据库磁盘使用率飙升
2. 原因分析
Debezium 使用的 PostgreSQL 逻辑复制槽如果处于不活跃状态,会导致 WAL(预写日志)文件无法自动清理,从而堆积占用大量磁盘空间。
一个是因为同步的是会全量同步或大规模增量同步(如整表刷新)会在短时间内产生巨量数据变更;再就是同步任务(如逻辑复制、流复制)依赖复制槽(Replication Slot)保留 WAL 日志,确保下游消费不丢失数据。若下游消费延迟或崩溃,复制槽的 restart_lsn 位置停滞,导致主库无法清理此前所有 WAL 文件。也就是生成快+清理慢导致磁盘存储飙升。
3. 处理过程
3.1 查询不活跃的复制槽
执行以下 SQL (示例)检查是否存在 active='f'(不活跃)的复制槽:
select slot_name, active, database from pg_replication_slots where active='f';
若结果中包含 Debezium 相关的复制槽(如 debezium_xxx),则需处理。
3.2 删除不活跃的复制槽
确认复制槽不再使用后,执行删除命令(替换 【slots_name】 为实际名称):
select * from pg_drop_replication_slot('【slots_name】');
删除后,系统会自动清理堆积的 WAL 日志,立即释放磁盘空间。