欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

浅谈PostgreSQL 11 新特性之默认分区

程序员文章站 2022-07-03 08:03:31
文章目录posgtresql 11 支持为分区表创建一个默认(default)的分区,用于存储无法匹配其他任何分区的数据。显然,只有 range 分区表和 list 分区表需要默认分区。create...

文章目录

posgtresql 11 支持为分区表创建一个默认(default)的分区,用于存储无法匹配其他任何分区的数据。显然,只有 range 分区表和 list 分区表需要默认分区。

create table measurement (
  city_id     int not null,
  logdate     date not null,
  peaktemp    int,
  unitsales    int
) partition by range (logdate);
create table measurement_y2018 partition of measurement
  for values from ('2018-01-01') to ('2019-01-01');

以上示例只创建了 2018 年的分区,如果插入 2017 年的数据,系统将会无法找到相应的分区:

insert into measurement(city_id,logdate,peaktemp,unitsales)
values (1, '2017-10-01', 50, 200);
error: no partition of relation "measurement" found for row
detail: partition key of the failing row contains (logdate) = (2017-10-01).

使用默认分区可以解决这类问题。创建默认分区时使用 default 子句替代 for values 子句。

create table measurement_default partition of measurement default;
\d+ measurement
                 table "public.measurement"
 column  | type  | collation | nullable | default | storage | stats target | description 
-----------+---------+-----------+----------+---------+---------+--------------+-------------
 city_id  | integer |      | not null |     | plain  |       | 
 logdate  | date  |      | not null |     | plain  |       | 
 peaktemp | integer |      |     |     | plain  |       | 
 unitsales | integer |      |     |     | plain  |       | 
partition key: range (logdate)
partitions: measurement_y2018 for values from ('2018-01-01') to ('2019-01-01'),
      measurement_default default

有了默认分区之后,未定义分区的数据将会插入到默认分区中:

insert into measurement(city_id,logdate,peaktemp,unitsales)
values (1, '2017-10-01', 50, 200);
insert 0 1
select * from measurement_default;
 city_id | logdate  | peaktemp | unitsales 
---------+------------+----------+-----------
    1 | 2017-10-01 |    50 |    200
(1 row)

默认分区存在以下限制:

一个分区表只能拥有一个 default 分区;

对于已经存储在 default 分区中的数据,不能再创建相应的分区;参见下文示例;

如果将已有的表挂载为 default 分区,将会检查该表中的所有数据;如果在已有的分区中存在相同的数据,将会产生一个错误;

哈希分区表不支持 default 分区,实际上也不需要支持。

使用默认分区也可能导致一些不可预见的问题。例如,往 measurement 表中插入一条 2019 年的数据,由于没有创建相应的分区,该记录同样会分配到默认分区:

insert into measurement(city_id,logdate,peaktemp,unitsales)
values (1, '2019-03-25', 66, 100);
insert 0 1
select * from measurement_default;
 city_id | logdate  | peaktemp | unitsales 
---------+------------+----------+-----------
    1 | 2017-10-01 |    50 |    200
    1 | 2019-03-25 |    66 |    100
(2 rows)

此时,如果再创建 2019 年的分区,操作将会失败。因为添加新的分区需要修改默认分区的范围(不再包含 2019 年的数据),但是默认分区中已经存在 2019 年的数据。

create table measurement_y2019 partition of measurement
  for values from ('2019-01-01') to ('2020-01-01');
error: updated partition constraint for default partition "measurement_default" would be violated by some row

为了解决这个问题,可以先将默认分区从分区表中卸载(detach partition),创建新的分区,将默认分区中的相应的数据移动到新的分区,最后重新挂载默认分区。

alter table measurement detach partition measurement_default;
create table measurement_y2019 partition of measurement
  for values from ('2019-01-01') to ('2020-01-01');
insert into measurement_y2019
select * from measurement_default where logdate >= '2019-01-01' and logdate < '2020-01-01';
insert 0 1
delete from measurement_default where logdate >= '2019-01-01' and logdate < '2020-01-01';
delete 1
alter table measurement attach partition measurement_default default;
create table measurement_y2020 partition of measurement
  for values from ('2020-01-01') to ('2021-01-01');
\d+ measurement
                 table "public.measurement"
 column  | type  | collation | nullable | default | storage | stats target | description 
-----------+---------+-----------+----------+---------+---------+--------------+-------------
 city_id  | integer |      | not null |     | plain  |       | 
 logdate  | date  |      | not null |     | plain  |       | 
 peaktemp | integer |      |     |     | plain  |       | 
 unitsales | integer |      |     |     | plain  |       | 
partition key: range (logdate)
partitions: measurement_y2018 for values from ('2018-01-01') to ('2019-01-01'),
      measurement_y2019 for values from ('2019-01-01') to ('2020-01-01'),
      measurement_y2020 for values from ('2020-01-01') to ('2021-01-01'),
      measurement_default default

官方文档:table partitioning

补充:postgresql10以上的自动分区分表功能

一.列分表

1.首先创建主分区表:

create table fenbiao( 
id int, 
year varchar 
) partition by list(year)

这里设置的是根据year列进行数据分表;创建后使用navicat是看不到的;

2.创建分表:

create table fenbiao_2017 partition of fenbiao for values in ('2017')

create table fenbiao_2018 partition of fenbiao for values in ('2018')

这样这两天数据会依靠规则插入到不同分表中,如果插入一条不符合规则的数据,则会报错误:no partition of relation "fenbiao" found for row.

二.范围分表

1.以year列为范围进行分表

create table fenbiao2( 
id int, 
year varchar 
) partition by range(year)

2.创建分表

create table fenbiao2_2018_2020 partition of fenbiao2 for values from ('2018') to ('2020')

create table fenbiao2_2020_2030 partition of fenbiao2 for values from ('2020') to ('2030')

注意:此时插入year=2020会插入到下面的表;如下面表范围为2021到2030,则会报错;同时插入2030也会报错;范围相当于时a<=year<b;

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。