Hbase的安装和配置

程序员文章站 2022-07-05 08:25:09

Hbase简介Hbase概述Hbase原型是Google的BigTable论文，受到了改论文思想的启发，目前作为Hadoop的子项目来开发维护，用于支持结构化的数据存储。Hbase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用Hbase技术可以在廉价的服务器上搭建起大规模的结构化存储集 ......

hbase简介
hbase概述
hbase原型是google的bigtable论文，受到了改论文思想的启发，目前作为hadoop的子项目来开发维护，用于支持结构化的数据存储。
hbase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用hbase技术可以在廉价的服务器上搭建起大规模的结构化存储集群。
hbase的目标是存储并处理大型的数据，更具体来说是仅需使用普通的硬件配置，就能处理由成千上万的行和列所组成的大型数据。
hbase的核心是能够实现在hdfs中数据的随机读写。
hbase的特点：
海量存储、列式存储（列族存储）、极易扩展、高并发、稀疏（列族中可以制定任意多的列，列数据可以为空，并且该情况下不会占用存储空间）
1.没有真正的索引：行是顺序存储的，每行中的列也是，所以不存在索引膨胀的问题，而且插入性能和表的大小无关。
2.自动分区：在表增长的时候，表会自动分裂成区域，并分布到可用的节点上。
3.线性扩展和对于新节点的自动处理：增加一个节点，把它指向现有集群并运行regionserver。区域自动重新进行平衡，负载均匀分布。
4.普通商用硬件支持：集群可以用1000~5000美金的单个节点搭建，而不需要使用单个5万美金的节点。rdbms需要支持大量i/o，因此要求更昂贵的硬件。
5.容错：大量节点意味着每个节点的重要性并不突出。不用担心单个节点失效。
6.批处理 mapreduce集成功能使我们可用全并行的分布式作业根据“数据的位置”来批处理它们。
hbase结构
datanode是管理存储数据的进程，并不是实质的存储节点。
使用hbase必须先启动hadoop和zookeeper，用来支持hdfs存储数据和高可用，高可用是namenode做集群并将元数据存储在zookeeper中。
hbase的分布式安装部署
集群规划：三台服务器上部署hbase集群，基于前面的文章中已经部署的hadoop、zookeeper环境的三台虚拟机。
Hbase的安装和配置

选择版本进行下载，此处选择的是hbase-2.0.5
Hbase的安装和配置

将压缩包使用xftp上传hadoop-1的/usr目录下：
Hbase的安装和配置

进入/usr目录，使用tar命令将压缩包进行解压，执行命令：

1 # tar zxvf hbase-2.0.5-bin.tar.gz

Hbase的安装和配置

解压完成后会在/usr目录下生成hbase-2.0.5目录：
Hbase的安装和配置

进入hbase的配置文件目录，并查看该目录下的文件：

1 # cd hbase-2.0.5/conf/
2 # ll

Hbase的安装和配置

使用vim编辑配置文件hbase-env.sh，更改内容如下：
Hbase的安装和配置

使用vim编辑配置文件hbase-site.xml，更改内容如下：
Hbase的安装和配置

配置文件参数说明：

配置项	值	说明
hbase.rootdir	hdfs://hadoopnn:9000/hbase_db	region servers共享的目录
hbase.cluster.distributed	true	值为true则是分布式模式
hbase.zookeeper.quorum	hadoopnn,hadoopdn1,hadoopdn2	使用逗号分隔的zookeeper集合中的服务器列表
hbase.zookeeper.property.clientport	2181	客户端将连接的端口
hbase.zookeeper.property.datadir	/usr/hbase-2.0.5/zk_data	快照存储的目录
hbase.tmp.dir	/usr/hbase-2.0.5/tmp	本地文件系统上的临时目录

使用vim编辑配置文件regionservers，更改内容如下：
Hbase的安装和配置

然后将/usr目录下的hbase-2.0.5远程拷贝到hadoop-2和hadoop-3主机的/usr目录下：

1 # scp -r /usr/hbase-2.0.5 hadoop-2:/usr
2 # scp -r /usr/hbase-2.0.5 hadoop-3:/usr

Hbase的安装和配置

在hadoop-1主机上执行start-all.sh启动hadoop集群，jps命令查看hadoop-1上的启动了namenode等进程：
Hbase的安装和配置

hadoop-2和hadoop-3上启动了datanode等进程：
Hbase的安装和配置

分别在三台主机上按照顺序启动zookeeper集群：

1 # zkserver.sh start

Hbase的安装和配置

并使用jps命令查看zookeeper集群启动成功。
在三台主机上分别使用vim编辑环境变量，更改内容如下：

1 # vim /etc/profile

Hbase的安装和配置

保存退出，执行命令是修改生效：

1 # source /etc/profile

执行start-hbase.sh启动hbase集群：

1 # start-hbase.sh

Hbase的安装和配置

并使用jps查看进程，hadoop-1中启动了hmaster进程，hadoop-2和hadoop-3中启动了hregionserver进程，hbase集群启动成功。
Hbase的安装和配置

Hbase的安装和配置

在浏览器中输入：[http://192.168.44.128:16010](http://192.168.44.128:16010/)，即可打开hbase的web页面：
Hbase的安装和配置

Hbase的安装和配置

注意：hbase集群是hmaster管理整个集群，为了实现hmaster的高可用，可以在集群的其他主机上启用备份hmaster服务，每个集群最多可以启动9个备份hmaster服务：

1 # local-master-backup.sh start 2

2为默认端口的偏移量，每个hmaster使用两个端口（默认为16000和16010），例如在hadoop-2执行该命令，则备份hmaster服务的端口为16012。
此时在浏览器中打开备份服务的ip:16012，即可看到集群中的hmaster的状态信息。
若要终止备份hmaster服务，需要查看该备份服务的pid，然后使用kill -9杀死该进程即可。

上一篇： ngxin ./configure信息备忘

下一篇： rpm -qa | grep

Hbase的安装和配置

PHP使用 Pear 进行安装和卸载包的方法详解

Google开源的Python格式化工具YAPF的安装和使用教程

vue新vue-cli3环境配置和模拟json数据的实例

hadoop和hbase的关系（flume数据采集）

VS2015开发环境的安装和配置

CorePlex的安装、配置和使用图文教程

JDK1.6的下载、安装与配置图文详细教程推荐

linux批量备份服务器配置文件和目录的脚本

Windows7旗舰版32位Oracle10g的安装和卸载教程

RubyMine编辑器中安装CoffeeScript和CoffeeScriptRedux的方法

Hbase的安装和配置

PHP使用 Pear 进行安装和卸载包的方法详解

Google开源的Python格式化工具YAPF的安装和使用教程

vue新vue-cli3环境配置和模拟json数据的实例

hadoop和hbase的关系（flume数据采集）

VS2015开发环境的安装和配置

CorePlex的安装、配置和使用图文教程

JDK1.6的下载、安装与配置图文详细教程 推荐

linux批量备份服务器配置文件和目录的脚本

Windows7旗舰版32位Oracle10g的安装和卸载教程

RubyMine编辑器中安装CoffeeScript和CoffeeScriptRedux的方法

JDK1.6的下载、安装与配置图文详细教程推荐