当前位置: 首页 > news >正文

PostgreSQL 表空间占用分析与执行计划详解

PostgreSQL 表空间占用分析与执行计划详解
引言
在数据库管理和优化中,了解表占用的空间大小以及查询的执行计划是至关重要的。本文将详细介绍如何在 PostgreSQL 中查看普通表和分区表的空间占用情况,以及如何分析和解读执行计划。

一、查看表空间占用
1. 普通表空间查看
PostgreSQL 提供了多个函数来查看表的空间占用情况:

-- 查看表的基本信息(包括大小)
\d+ 表名

-- 查看表的总大小(包括索引、TOAST等)
SELECT pg_size_pretty(pg_total_relation_size('schema_name.table_name'));

-- 查看表数据大小(不包括索引)
SELECT pg_size_pretty(pg_relation_size('schema_name.table_name'));

-- 查看表索引大小
SELECT pg_size_pretty(pg_indexes_size('schema_name.table_name'));

-- 查看数据库中所有表的大小
SELECT
    table_schema,
    table_name,
    pg_size_pretty(pg_total_relation_size('"'||table_schema||'"."'||table_name||'"')) as size
FROM information_schema.tables
WHERE table_schema NOT IN ('pg_catalog', 'information_schema')
ORDER BY pg_total_relation_size('"'||table_schema||'"."'||table_name||'"') DESC;
2. 分区表空间查看
对于分区表,需要计算所有子分区的总和:

-- 查看分区表及其所有子分区的详细大小
SELECT 
    pg_size_pretty(sum(pg_total_relation_size(inhrelid::regclass))) AS total_size
FROM 
    pg_inherits
WHERE 
    inhparent = 'scheme.table_name'::regclass;
二、执行计划详解
1. 获取执行计划
EXPLAIN ANALYZE SELECT * FROM table_name WHERE condition;
2. 执行计划关键节点解读
(1) Seq Scan (顺序扫描)
全表扫描,适合小表或需要大部分数据的情况
成本估算:(cost=0.00..100.00 rows=1000 width=50)
(2) Index Scan (索引扫描)
使用索引查找数据
包括:Index Scan、Index Only Scan
成本通常低于顺序扫描
(3) Bitmap Heap Scan
先通过索引获取符合条件的行位置,再访问表数据
适合中等选择性的查询
(4) Nested Loop
嵌套循环连接,适合小表连接
外层循环每行在内层循环中查找匹配
(5) Hash Join
哈希连接,适合中等大小表连接
先为较小表构建哈希表
(6) Merge Join
合并连接,适合已排序的大表连接
3. 执行计划优化提示
关注高成本操作:查看执行计划中成本最高的节点
检查预估与实际行数差异:大差异可能表明统计信息不准确
识别全表扫描:对大表的全表扫描通常是性能瓶颈
检查连接策略:确保使用了最优的连接方式
查看排序和聚合操作:这些操作可能消耗大量内存
4. 执行计划优化示例
-- 优化前
EXPLAIN ANALYZE SELECT * FROM orders JOIN customers ON orders.customer_id = customers.id;

-- 添加索引后
CREATE INDEX idx_orders_customer_id ON orders(customer_id);
EXPLAIN ANALYZE SELECT * FROM orders JOIN customers ON orders.customer_id = customers.id;
三、空间与性能综合优化建议
定期维护:

VACUUM ANALYZE table_name;  -- 回收空间并更新统计信息
REINDEX TABLE table_name;   -- 重建索引
分区策略优化:

按时间范围分区(适用于时间序列数据)
按ID范围或哈希分区(分散I/O压力)
索引优化:

为常用查询条件创建适当索引
考虑部分索引和表达式索引
定期监控索引使用情况
TOAST优化:

对大文本字段考虑使用压缩
对很少查询的大字段考虑单独存储
结语
通过合理监控表空间使用情况和分析执行计划,可以显著提高PostgreSQL数据库的性能和资源利用率。定期进行这些分析应该是DBA日常工作的重要组成部分。

相关文章:

  • 【时时三省】(C语言基础)二维数组举例
  • python调用国税乐企直连接口开数电票之额度管理
  • Cjson格式解析与接入AI大模型
  • RAIL-KD: 随机中间层映射知识蒸馏
  • UE5骨骼插槽蓝图
  • 软件系统中功能模型 vs 数据模型 对比解析
  • TextRNN 模型实现微博文本情感分类
  • AD原理图复制较多元器件时报错:“InvalidParameter Exception Occurred In Copy”
  • 推送到Gerrit时报错,缺少Change-Id
  • djinn: 3靶场渗透
  • java的输入输出模板(ACM模式)
  • 古方焕新潮!李良济盒马联名养生水,以创新赋能中式养生新潮流
  • 出现在‘{‘的段错误
  • Qt读写XML文档
  • linux动态占用内存脚本、根据阈值增加占用或取消占用内存的脚本、自动检测占用脚本状态,多脚本套用
  • 力扣-24.两两交换链表中的结点
  • 可视化图解算法36: 序列化二叉树-I(二叉树序列化与反序列化)
  • Rust 中的 `PartialEq` 和 `Eq`:深入解析与应用
  • R1-Omni
  • SAP note 3565626 : Baltimore CyberTrust 根证书即将过期
  • 广西钦州:坚决拥护自治区党委对钟恒钦进行审查调查的决定
  • 古埃及展进入百天倒计时,闭幕前168小时不闭馆
  • 稳住外贸基本盘,这个中部大省出手了
  • 19岁女生注射头孢离世后续:院方道歉,医生停职,监管介入
  • 上海推动AI+文旅深度融合,MaaS平台和产业基地落地徐汇
  • 毗邻三市人均GDP全部超过20万元,苏锡常是怎样做到的?