当前位置: 首页 > news >正文

PostgreSQL 的 VACUUM 与 VACUUM FULL 详解

PostgreSQL 的 VACUUM 与 VACUUM FULL 详解

一、基本概念对比

特性VACUUMVACUUM FULL
定义常规维护操作,清理死元组激进重组操作,完全重写表数据
锁级别不阻塞读写(共享锁)排他锁(阻塞所有操作)
空间回收只标记空间为可用,不返还OS空间返还操作系统
索引处理不重建索引完全重建所有索引
执行速度快(增量式)慢(全量重写)
对系统影响

二、工作机制详解

1. VACUUM 工作原理

  • 死元组清理:标记被删除或更新旧版本的数据为"可重用"
  • 事务ID处理:防止事务ID回卷(冻结旧事务ID)
  • 更新统计信息:为查询优化器提供最新数据分布信息
  • 不减少物理文件大小:只是内部空间重用

2. VACUUM FULL 工作原理

  1. 创建表的全新副本
  2. 只将有效数据写入新存储
  3. 删除原始表文件
  4. 将新文件重命名为原表名
  5. 完全重建所有索引(因为元组物理位置改变)

三、使用场景对比

适合使用 VACUUM 的场景

  • 常规数据库维护(建议配置autovacuum)
  • 高并发OLTP系统
  • 频繁更新的表(每天或每小时)
  • 只需要空间重用,不需OS空间回收

适合使用 VACUUM FULL 的场景

  • 表膨胀严重(>30%空间浪费)
  • 准备进行大版本升级前
  • 长期未维护的历史表
  • 需要彻底重组表物理结构时

四、性能影响分析

VACUUM 影响

-- 典型资源占用
CPU: 5-15% 
IO: 中等(取决于表大小)
锁: 不阻塞查询,可能与DDL冲突
持续时间: 几分钟到几小时(大表)

VACUUM FULL 影响

-- 典型资源占用
CPU: 30-70%
IO: 非常高(读写全表数据)
锁: 完全阻塞表访问
持续时间: 几小时到几天(特大表)

五、实际操作示例

基本语法

-- 普通VACUUM
VACUUM [VERBOSE] [ANALYZE] [table_name];
-- 示例
VACUUM VERBOSE ANALYZE orders;-- VACUUM FULL
VACUUM FULL [VERBOSE] [table_name];
-- 示例
VACUUM FULL VERBOSE large_table;

监控命令

-- 查看表膨胀情况
SELECTschemaname || '.' || relname AS table_name,pg_size_pretty(pg_total_relation_size(relid)) AS total_size,pg_size_pretty(pg_relation_size(relid)) AS data_size,n_live_tup AS live_tuples,n_dead_tup AS dead_tuples,round((n_dead_tup::numeric / (n_live_tup + n_dead_tup) * 100), 2) AS dead_tuple_percent,last_vacuum,last_autovacuum
FROM pg_stat_user_tables
WHERE n_live_tup > 0
ORDER BY dead_tuple_percent DESC;

六、最佳实践建议

  1. 常规维护策略

    • 启用并合理配置autovacuum
    • 对大表设置更频繁的vacuum阈值
    ALTER TABLE large_table SET (autovacuum_vacuum_scale_factor = 0.01,autovacuum_vacuum_threshold = 1000
    );
    
  2. VACUUM FULL 替代方案

    • 使用pg_repack扩展(在线重组,不阻塞读写)
    -- 安装后使用
    pg_repack -d dbname -t table_name
    
    • 手动创建新表交换(需要更多步骤)
  3. 特殊场景处理

    • 对于只读表,可以禁用autovacuum
    ALTER TABLE historical_data SET (autovacuum_enabled = false
    );
    
    • 紧急空间回收时考虑在维护窗口使用VACUUM FULL

相关文章:

  • 【git】获取特定分支和所有分支
  • 【Linux深入浅出】之全连接队列及抓包介绍
  • 阿里云服务器防御是怎么做出来的?服务器攻击方式有几种?
  • Java文件上传
  • 【算法基础】选择排序算法 - JAVA
  • ARM 指令集(ubuntu环境学习)第六章:ARM 编程技巧与优化策略
  • 供应链算法整理(一)--- 销量预估
  • 如何掌握 Lustre/Scade 同步数据流语言
  • 基于建造者模式的信号量与理解建造者模式
  • 每日算法-250502
  • Python爬虫实战:获取好大夫在线各专业全国医院排行榜数据并分析,为患者就医做参考
  • 传统银行服务和 区块链支付无缝融合的一种解决方案
  • 【AI面试准备】数据治理与GDPR脱敏机制构建
  • 4.Java中的注释
  • VBA宏即根据第一列的内容和第二列的数字,按照数字数量生成对应内容并依次放在第三列、第四列等
  • c++环境和vscode常用的一些有用插件
  • Qt C++简单图形界面与绘图实验
  • 开闭原则与依赖倒置原则区别:原类不变,新增类(功能)vs 接口类不变,原实现类可变
  • 算法篇(九)【滑动窗口】
  • 《筑牢防线:全方位守护移动应用免受逆向侵扰》
  • 重庆市大渡口区区长黄红已任九龙坡区政协党组书记
  • 燕子矶:物流网络中的闪亮节点|劳动者的书信②
  • 香港发生车祸致22人受伤,4人伤势严重
  • 国铁集团:5月1日全国铁路预计发送旅客2250万人次
  • 万达电影去年净利润亏损约9.4亿元,计划未来三年内新增25块IMAX银幕
  • 荣盛发展股东所持1.17亿股将被司法拍卖,起拍价约1.788亿元