PostgreSQL事务与并发清理
1.并发清理概述
清理过程为指定的表,或数据库中的所有表执行以下任务。
1. 移除死元组
移除每一页中的死元组,并对每一页内的活元组进行碎片整理。
移除指向死元组的索引元组。
2. 冻结旧的事务标识(txid)
如有必要,冻结旧元组的事务标识(txid)。
更新与冻结事务标识相关的系统视图(pg_database与pg_class)。
如果可能,移除非必需的提交日志(clog)。
3. 其他
更新已处理表的空闲空间映射(FSM)和可见性映射(VM)。
更新一些统计信息(pg_stat_all_tables等)。
2.伪代码描述清理的过程
该伪码分为两大块:一块是依次处理表的循环,一块是后处理逻辑。而循环块又能分为三个部分,每一个部分都有各自的任务。接下来会描述这三个部分,以及后处理的逻辑。
- 第一部分
执行冻结处理,并删除指向死元组的索引元组。
- 第二部分
移除死元组,并逐页更新FSM和VM。
- 第三部分
针对每个表,更新与清理过程相关的统计信息和系统视图。
- 后续处理
当处理完成后,PostgreSQL会更新与清理过程相关的几个统计数据,以及相关的系统视图;如果可能的话,它还会移除部分非必需的clog。