欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

PostgreSQL表膨胀监控案例(精确计算)

程序员文章站 2022-06-21 11:58:32
膨胀率的精确计算postgresql自带了pgstattuple模块,可用于精确计算表的膨胀率。譬如这里的tuple_percent字段就是元组实际字节占关系总大小的百分比,用1减去该值即为膨胀率。#...

膨胀率的精确计算

postgresql自带了pgstattuple模块,可用于精确计算表的膨胀率。譬如这里的tuple_percent字段就是元组实际字节占关系总大小的百分比,用1减去该值即为膨胀率。

#插入1000w数据
postgres=# insert into t select id,id from generate_series(1,10000000) as id;
insert 0 10000000
 
#表膨胀系数为0.097
postgres=# select *, 1.0 - tuple_len::numeric / table_len as bloat from pgstattuple('t');
 table_len | tuple_count | tuple_len | tuple_percent | dead_tuple_count | dead_tuple_len | dead_tuple_percent | free_space | free_percent |   bloat   
-----------+-------------+-----------+---------------+------------------+----------------+--------------------+------------+--------------+------------------------
 442818560 | 10000001 | 400000040 |   90.33 |    0 |    0 |     0 | 1304976 |   0.29 | 0.09669540499838127833
(1 row)
 
#占用54055个page
postgres=# select * from pg_relpages('t');
 pg_relpages 
-------------
  54055
(1 row)
 
#删除数据
postgres=# delete from t where id<>10000000;
delete 9999999
 
#仍然占用54055个page
postgres=# select * from pg_relpages('t');
 pg_relpages 
-------------
  54055
(1 row)
 
#膨胀率已经为0.999999
postgres=# select *, 1.0 - tuple_len::numeric / table_len as bloat from pgstattuple('t');
 table_len | tuple_count | tuple_len | tuple_percent | dead_tuple_count | dead_tuple_len | dead_tuple_percent | free_space | free_percent |   bloat   
-----------+-------------+-----------+---------------+------------------+----------------+--------------------+------------+--------------+----------------------------
 442818560 |   2 |  80 |    0 |   9999999 |  399999960 |    90.33 | 1304976 |   0.29 | 0.999999819339099065766349
 
#vacuum表
postgres=# vacuum (verbose,full,analyze) t;
info: vacuuming "public.t"
info: "t": found 5372225 removable, 2 nonremovable row versions in 54055 pages
detail: 0 dead row versions cannot be removed yet.
cpu: user: 0.89 s, system: 0.00 s, elapsed: 0.89 s.
info: analyzing "public.t"
info: "t": scanned 1 of 1 pages, containing 2 live rows and 0 dead rows; 2 rows in sample, 2 estimated total rows
vacuum

补充:pg索引膨胀问题---重建索引

问题:

发现数据库中很多表的索引大小超过数据大小。经检查,生产ca、cz、mu、hu、psg、riue库都存在这个现象。

原因:据运行同事介绍索引膨胀问题无法避免,频繁更新就会带来这个问题。

解决方法:

对于大的索引可以采用重建的方式解决。以下两种方法推荐第一种。

方法一:停止应用(这个操作会锁表),重建索引(注:重建完索引名称不变)

sql:reindex index 索引名称

时间:速度较快。2g大小的表,基本上1分钟左右可以建完索引。

还可以针对表重建索引,这个操作会加排他锁 :

reindex table 表名

方法二:在线建新索引,再把旧索引删除

sql:根据不同索引采用不同的建索引命令,例如:

普通索引

create index concurrently idx_tbl_2 on tbl(id);
drop index idx_tbl_1;

唯一索引

create unique index concurrently user_info_username_key_1 on user_info(username);
begin;
alter table user_info drop constraint user_info_username_key;
alter table user_info add constraint user_info_username_key unique using index user_info_username_key_1;
end;

主键索引

create unique index concurrently user_info_pkey_1 on user_info(id);
begin;
alter table user_info drop constraint user_info_pkey;
alter table user_info add constraint user_info_pkey primary key using index user_info_pkey_1;
end;

时间:不停应用的话,业务忙的时候可能会非常长的时间。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。