oracle分区表之hash分区表的使用及扩展
hash分区是通过对分区键运用hash算法从而决定数据的分区归属。使用hash分区有什么优点呢?
常用的分区表所具有的优点:如提高数据可用行,减少管理负担,改善语句性能等优点,hash分区同样拥有。此外,由于hash分区表是按分区键的hash计算结果来决定其分区的,而特定的分区键其hash值是固定的,也就是说hash分区表的数据是按分区键值来聚集的,同样的分区键肯定在同一分区。
比如,在证券行业,我们经常查询某一只股票的k线,
假设表的结构如下:
create table equity
(
id number,
trade_date date,
……);
equity表可能会很大,对equity表的查询通常都是指定id,查询某一交易日期或者某段时期内的其他信息。这种情况下我们需要如何为equity表选择分区呢?
单从表本身结构来看,似乎trade_date列很适合被选择用来作范围分区。但如果我们这样分区的话,前面需求中的查询:指定某一id,查询其某一范围内的交易信息,比如看1年内的k线,则这种查询常常需要跨分区。我们知道,对分区表作跨分区查询,很多时候其性能并不会太好,特别是这种查询很可能还要跨很多分区。
你也可能会说,我们再在id, trade_date列上建个索引不就行了,仔细想想是不是这样呢?这时候的equity表中的数据是按trade_date值来聚集的,同样trade_date值的数据常常在一个数据块中,这样前面需求中所描述的查询即使通过索引访问,最终读表时也常常是去读离散的数据块,即每一条记录需要对应读一个表数据块。
如果建成hash分区表,则数据按hash分区键聚集,就更适合需求中描述的查询,因为同样id的记录必定在同一分区,同时,同样 id值的记录落在同一数据块的几率也增大了,从而“一定程度上”减少了io。
上面对hash分区减少io的描述加了引号,因为仅依靠hash分区表试图实现大范围减少io操作是不现实的,特别是当equity表中记录的股票数非常多时,同一股票发生在不同交易日的记录在物理上也很难聚集到相同数据块中。实际上,如果我们在hash分区的基础上再对equity表采用iot表的组织方式,则前面描述的查询性能就可大为提高。iot表不在该文讨论的范围之内,这里就不作进一步讨论了。
当我们决定使用hash表之前,我们还需要确定我们的所选择的分区键值是连续分布的,或者接近连续分区,此外,分区的个数需要是2的整数幂,比如2,4,8… 这些要求是由hash函数的特点决定的,这样我们分区表的各个分区所包含的数据量才会比较平均。
hash分区表的扩展:
hash分区表是通过add partition命令来增加分区的。oracle推荐分区的个数是2的幂,比如,2,4,8..等等,这样可以确保数据在各个分区中分布比较均匀。当然,如前所述,还需要分区键值是连续分布的,或接近连续分布。
增加新分区时,需要将一些原有的数据从旧的分区划分到新的分区中,那么这种数据划分时来源分区选择遵循什么原则呢?
要点如下:如果要增加的分区是第n个分区,大于等于n的最小2的整数幂为m,则当增加第n个分区时,这个分区的数据来源于分区n-m/2。
比如,现在有个hash分区表共有100个分区,我们想为其增加一个分区,则它是101个分区,即上面公式中的n为101,而大于101的最小2的整数幂为128,则m为128,于是,这个101分区的数据来源就应该是101-128/2=37分区。
换个角度来说,当我们在增加第101分区的时候,是需要锁定37分区的,因为我们需要将该分区中的部分数据插入到新的101分区中。
下面,我们用一个实例来验证上面的说法,同时看看在实际操作中有什么需要注意的事项:
commodity表是我们系统中的一个大表,几年前在为该表创建hash分区表时,当时的dba在选择分区数时指定了100个分区:
select table_name,partition_position,partition_name,num_rows from user_tab_partitions where table_name=\'commodity\' order by partition_position;
table_name partition_position partition_name num_rows
-------------- ------------------ ---------------------- ----------
commodity 1 cot_ind01_p1 4405650
commodity 2 cot_ind01_p2 5046650
commodity 3 cot_ind01_p3 5107550
……
commodity 36 cot_ind01_p36 5718800
commodity 37 cot_ind01_p37 9905200
commodity 38 cot_ind01_p38 10118400
commodity 39 cot_ind01_p39 10404950
commodity 40 cot_ind01_p40 9730850
commodity 41 cot_ind01_p41 9457300
commodity 42 cot_ind01_p42 9717950
commodity 43 cot_ind01_p43 9643900
commodity 44 cot_ind01_p44 11138000
commodity 45 cot_ind01_p45 9381300
commodity 46 cot_ind01_p46 10101150
commodity 47 cot_ind01_p47 8809950
commodity 48 cot_ind01_p48 10611050
commodity 49 cot_ind01_p49 10010600
commodity 50 cot_ind01_p50 8252600
commodity 51 cot_ind01_p51 9709900
commodity 52 cot_ind01_p52 8983200
commodity 53 cot_ind01_p53 9012750
commodity 54 cot_ind01_p54 9310650
commodity 55 cot_ind01_p55 8966450
commodity 56 cot_ind01_p56 8832650
commodity 57 cot_ind01_p57 9470600
commodity 58 cot_ind01_p58 8932450
commodity 59 cot_ind01_p59 9994850
commodity 60 cot_ind01_p60 9617450
commodity 61 cot_ind01_p61 10278850
commodity 62 cot_ind01_p62 9277600
commodity 63 cot_ind01_p63 8136300
commodity 64 cot_ind01_p64 10064600
commodity 65 cot_ind01_p65 3710900
……
commodity 99 cot_ind01_p99 5273800
commodity 100 cot_ind01_p100 5293350
100 rows selected.
查询各个分区的数据分布,我们可以看到,从分区37 ~ 64的28个分区的记录数大概是其他分区的两倍。由于100不是2的整数幂,所以oracle的hash函数是无法保证数据是平均分布的。我们为该表添加一个新的分区cot_ind01_p101:
alter table nts_commodity_ts add partition cot_ind01_p101;
table altered.
elapsed: 00:06:58.52
收集统计信息后查询新的分区记录数:
select table_name,partition_position,partition_name,num_rows from user_tab_partitions where table_name=\'commodity\' and partition_name in (\'cot_iot_ind01_p37\',\'cot_iot_ind01_p101\');
table_name partition_position partition_name num_rows
------------------ ------------------ --------------------- ----------
commodity 37 cot__ind01_p37 4905200
commodity 101 cot_ind01_p101 5107550
这时,我们可以看到,分区37中的数据被接近于平分到了分区37和101中。
监控增加分区过程中session锁的情况,我们发现期间有两个对象被以exclusive模式锁定了:
sql> select * from v$lock where sid=1239 and type=\'tm\' and lmode=6 order by sid,lmode;
addr kaddr sid ty id1 id2 lmode request ctime block
---------------- ---------------- ---------- -- ---------- ---------- ---------- ---------- ---------- ----------
ffffffff7d764828 ffffffff7d764888 1239 tm 4004126 0 6 0 72 2
ffffffff7d764828 ffffffff7d764888 1239 tm 4004063 0 6 0 72 2
它们分别是什么对象呢?
select object_name,subobject_name,object_id from user_objects where object_id in (4004126,4004063)
object_name subobject_name object_id
--------------------- ------------------------------ ----------
commodity cot_ind01_p100 4004126
commodity cot_ind01_p37 4004063
可以看到,分区37和100都被锁定了。锁定37分区是意料中的事,因为要从该表转移数据。那为什么要锁定第100个分区,也就是最后一个分区呢?
我的理解是:新增加分区的位置101是由原分区表的分区数100确定的,如果在增加分区的过程中允许对原表最后一个分区100作ddl操作,如coalesce操作,则新加的101分区就不一定是从原来的分区37分配数据了,101分区本身应该是新的第100分区,这样就引起混乱了。到这里,你可能会说,按这理解,是不是其他的分区也应该锁定呢?其实不用,因为hash分区表是不支持drop partition操作的,而只支持coalesce操作来实现类似的操作,但coalesce只能从最后一个分区开始收缩。
了解了增加hash表分区过程中锁信息的实际指导意义是什么呢?
继续上例中的讨论,由于分区37和最后一个分区100会被排他锁定,因此在添加分区过程中这两个分区是不能作dml操作的,因为dml操作需要在分区上申请共享锁(mode为3)。也就是操作这两个分区的应用会受到影响。
hash表增加分区不会像其他类型分区表,如range分区那样能够迅速完成,因为这里添加分区的过程中是要有io操作的,要转移数据到新的分区。其实这还不是最主要的,由于hash表是根据分区键hash函数值来决定分区的,添加分区的主要时间其实是花在了计算hash值上。在上面的测试中,添加新分区操作的消耗时间是6分58秒,从下面的10046统计信息可以看到,其中6分钟都是花在了cpu操作上,相信主要是hash运算引起的。
[code]
overall totals for all recursive statements
call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
parse 328 0.17 0.27 0 0 148 0
execute 1520 360.14 396.30 456820 11416202 26357 11565252
fetch 1767 5.42 21.18 21421 26540 0 2862
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 3615 365.73 417.76 478241 11442742 26505 11568114
该测试案例中分区cot_ind01_p37*有接近1千万条数据,耗时接近7分钟,假设分区数据达到了1亿条,则耗时应该在1个小时以上。如果我们的hash分区数按oracle的建议为2的整数幂,则我们在增加分区时是要增加原有分区一倍的新分区,比如原分区为128个,扩展的时候需要增加128个分区,乘以每次添加分区需要的时间,则为hash表增加分区将是一个很恐怖的操作。
总之,hash分区有其优势,但也有严重的缺陷,比如这里描述的分区扩展问题。因此在项目设计之初,我们就需要慎重选择分区数。但是随着数据量的增加,我们又很难避免为分区表增加分区的操作,这种操作是很耗资源的操作,操作过程中由于锁的问题会影响对原有某些分区的操作。但如果我们因为畏惧前面存在的问题拖着不作分区扩展,则越是往后,随着数据量的增加,这种增加分区的操作越难以实施。