HBase笔记

程序员文章站 2022-04-10 12:38:54

1.应用场景和特点 hbase => 当数据量非常大的时候才会体现出hbase的优势特点：海量数据存储 => 单表可有上百亿行。上百万的列。也就是对列没有限制。 => 关系型数据库正常单表不超过五百万行，不超过三十列。面向列 => 动态添加数据的时候生成列。单独对列进行各种操作。多版本稀疏 ......

1.应用场景和特点

hbase => 当数据量非常大的时候才会体现出hbase的优势

特点：

海量数据存储 => 单表可有上百亿行。上百万的列。也就是对列没有限制。 => 关系型数据库正常单表不超过五百万行，不超过三十列。

面向列 => 动态添加数据的时候生成列。单独对列进行各种操作。

多版本

稀疏行 => 为空的列不占用磁盘空间。 => 关系型数据库当列为空的时候值会为null。也会占用磁盘空间

扩展性 => 底层依赖于HDFS => 数据内存不够的时候只需要动态添加机器就行。

高可靠性 =>

高性能 => 高写高读性能。

准实时查询 => 百毫秒实时查询上亿数据量

应用场景：

交通，金融，电商，移动...

概念与定位

概念：

如何选择合适hbase的版本

官网版本 => https://archive.apache.org/dist/hbase/ => 较新

cdh版本 => http://archive.cloudera.com/cdh5/ => 较稳定，兼容性优。

定位：认识hbase在hadoop2.x生态系统中的定位

HBase笔记

架构体系与设计模型

架构体系：

HBase笔记

宏观图分析：
hbase内部有两个主要的进程服务 => Master/RegionServer

hbase依赖与两个外部服务 => HDFS（hbase的数据是基于HDFS存储的，也就是说写入hbase的数据最终落入到HDFS分布式文件系统中）/ZooKeeper（分布式的框架）

regionserver管理集群上面的数据。会及时报告信息（状态和管理内容）给master服务。也会报告zookeeper。

设计模型：

关系型数据库：只需要设计数据库的列。并且要确定列的值，才能对数据进行操作。

hbase：面向列（列蔟）的数据库，不需要先制定列。只需要设定列蔟。

HBase笔记

例如下图

HBase笔记

在hbase表设计的时候，只需要确定column family即可。column family 的子列不需要制定，子列的生成是数据的动态增加而自动生成的。

表结构数据模型说明：

HBase笔记

列蔟的概念：

HBase笔记

hbase数据库与关系型数据的对比：

HBase笔记

上一篇： Python中的单例模式与反射机制详解

下一篇：酷派COOL20Pro后盖是什么材质后盖材质详情介绍

HBase笔记

笔记本电脑主板分组供电电路查找方法

教你打造超级笔记本电脑高能电池

使用联想手机与笔记本通过蓝牙连接、上网设置与图解

笔记本的散热方式

thinkpad笔记本摄像头灯一直亮着怎么关？

笔记本一直充电好不好？对电池有没有影响？

惠普Pavilion x360变形笔记本发布 5月开卖

笔记本开机进不去系统错误代码0xc000000f的解决办法

三星笔记本开机启动失败出现all boot options are tried

笔记本usb坏了插U盘没有反应怎么办？

HBase笔记

笔记本电脑主板分组供电电路查找方法

教你打造超级笔记本电脑高能电池

使用联想手机与笔记本通过蓝牙连接、上网设置与图解

笔记本的散热方式

thinkpad笔记本摄像头灯一直亮着怎么关？

笔记本一直充电好不好？对电池有没有影响？

惠普Pavilion x360变形笔记本发布 5月开卖

笔记本开机进不去系统 错误代码0xc000000f的解决办法

三星笔记本开机启动失败 出现all boot options are tried

笔记本usb坏了插U盘没有反应怎么办？

笔记本开机进不去系统错误代码0xc000000f的解决办法

三星笔记本开机启动失败出现all boot options are tried