HBase的物理存储结构
程序员文章站
2024-03-20 20:44:04
...
1.物理存储结构
1.每一张表从行键的方向上进行切分,切分成1个到多个HRegion - 也就意味着每一张表是由1到多个HRegion构成的
2.每一个HRegion保存当前HRegion的startRowKey和endRowKey
3.每一个HRegion分布到某一个HRegionServer节点上 - 进行切分的目的:
(1)将数据分布在不同的节点上以能够存储海量数据
(2)提高读写效率 - 提高HBase的吞吐量
(3)负载均衡
4.由于行键是默认按照字典序排序且每一个HRegion都记录了起始行键和结束行键,
所以在添加数据的时候可以锁定一个唯一的HRegion
5.当HRegion的大小默认达到10G之后,HRegion会进行分裂,平均的分裂成2个HRegion,
其中的一个HRegion就会挪到其他节点上存储
6.HRegion是分布式存储的基本单位也是负载均衡的基本单位
7.HRegion并不是HBase中数据存储的最小单位,HBase中数据存储的最小单位HStore
8.每一个HRegion中至少包含1个HStore,HStore的数量由列族的数量决定,
每一个列族都会在HRegion去对应一个HStore
9.每一个HStore中包含1个memStore(写缓存)以及0到多个StoreFile(HFile)
推荐阅读