欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

HBase的物理存储结构

程序员文章站 2024-03-20 20:44:04
...

1.物理存储结构

1.每一张表从行键的方向上进行切分,切分成1个到多个HRegion - 也就意味着每一张表是由1到多个HRegion构成的
2.每一个HRegion保存当前HRegion的startRowKey和endRowKey
3.每一个HRegion分布到某一个HRegionServer节点上 - 进行切分的目的:
(1)将数据分布在不同的节点上以能够存储海量数据
(2)提高读写效率 - 提高HBase的吞吐量
(3)负载均衡
4.由于行键是默认按照字典序排序且每一个HRegion都记录了起始行键和结束行键,
所以在添加数据的时候可以锁定一个唯一的HRegion
5.当HRegion的大小默认达到10G之后,HRegion会进行分裂,平均的分裂成2个HRegion,
其中的一个HRegion就会挪到其他节点上存储

HBase的物理存储结构

6.HRegion是分布式存储的基本单位也是负载均衡的基本单位

HBase的物理存储结构

7.HRegion并不是HBase中数据存储的最小单位,HBase中数据存储的最小单位HStore
8.每一个HRegion中至少包含1个HStore,HStore的数量由列族的数量决定,
每一个列族都会在HRegion去对应一个HStore
9.每一个HStore中包含1个memStore(写缓存)以及0到多个StoreFile(HFile)

HBase的物理存储结构