欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

数据库行存储格式

程序员文章站 2024-01-19 22:05:40
...

调研的几种数据库的行格式,代码没看,查的文档,可能具体实现并不一致。 几种格式的优缺点,还有待分析。 在oceanbase0.5中,实现的格式太简单,在一些场景下性能差,或是不太方便。 在oceanbase1.0中,现在我打算是写成一个通用的接口,可以以表为单位选择

调研的几种数据库的行格式,代码没看,查的文档,可能具体实现并不一致。

几种格式的优缺点,还有待分析。

在oceanbase0.5中,实现的格式太简单,在一些场景下性能差,或是不太方便。

在oceanbase1.0中,现在我打算是写成一个通用的接口,可以以表为单位选择需要的格式,这个有待讨论。

1.oracle

https://docs.oracle.com/cd/B28359_01/server.111/b28318/schema.htm#CNCPT1135

数据库行存储格式数据库行存储格式

rowheader至少3个字节

column length 1个字节,column 可以存储

column length 3个字节,column 可以存储>250个字节

如果不是行尾部的NULL,只有column length,没有column value

如是行尾部的NULL,column length, column value都不存

新加的列放在row的尾部

2.mysql innodb格式

http://hedengcheng.com/?p=127

null bitmap + column value

column value根据类型由定长和不定长的区别,如果是不定长,则格式为(size + value),size表示数据的长度,可以为1,2,3,4个字节。

3.PostgreSQL格式

http://sydney.edu.au/engineering/it/~info3404/lectures/02adv_RowFormats.pdf

数据库行存储格式数据库行存储格式

null bit map: (|columns| + 7)/8 个字节

OID:4个字节,用来表示PSQL支持的objects

RowData=FixColumns + VarColumns:

FixColumns:直接存储+补齐

VarColumns:varattrib+userdata+aligned

varattrib:4字节长度(2个位表示压缩或TOAST flags)

4.SQL server 2005

数据库行存储格式数据库行存储格式

http://sydney.edu.au/engineering/it/~info3404/lectures/02adv_RowFormats.pdf

rowheader:4个字节

2个表示record metadata

2个指向后面的BitMap

fixed-length data

null bit mpa: 2+((|columns| + 7)/8)个字节 (2个字节表示列数)

variable-length column data: 2+(Num_variable_cols * 2) + max_var_size (2个字节表示列数,每个列用2上字节表示colun value的offset)

versioning tag: (可选的)

5.oceanbase当前memtable的格式

SPARSE

Row Data + 行结束符

RowData = (TypeAttr + Value + column id) + 。。。

6.oceanbase当前cs sstable当前使用的格式

DENSE_DENSE

rowkey data + 行结束符 + row value + 行结束符

rowkey data = (TypeAttr + value) + …

rowvalue data = (TypeAttr + value) + …

7.oceanbase当前ups sstable当前使用的格式

DENSE_SPARSE

rowkey data + 行结束符 + row value + 行结束符

rowkey data = (TypeAttr + value) + …

rowvalue data = (TypeAttr + Value + column id) + 。。。