欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Hbase与Hive对比

程序员文章站 2022-07-12 22:19:49
...

Hbase与Hive对比

1、Hive

Hbase与Hive对比

1.1、数据仓库

Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询(将结构化数据映射成一张表)。

1.1、用于数据分析、清洗

Hive适用于离线的数据分析和清洗,延迟较高

1.2、基于HDFS、MapReduce

Hive存储的数据依旧在DataNode上,编写的HQL语句终将是转换为MapReduce代码执行。(不要钻不需要执行MapReduce代码的情况的牛角尖)

2、HBase

Hbase与Hive对比

2.1、数据库

是一种面向列存储的非关系型数据库。

2.2、用于存储结构化和非结构化的数据

适用于单表非关系型数据的存储,不适合做关联查询,类似JOIN等操作。

2.3、基于HDFS

数据持久化存储的体现形式是Hfile,存放于DataNode中,被ResionServer以region的形式进行管理。

2.4、延迟较低,接入在线业务使用

面对大量的企业数据,HBase可以直线单表大量数据的存储,同时提供了高效的数据访问速度。

3.总结

Hive和Hbase是两种基于Hadoop的不同技术,Hive是一种类SQL的引擎,并且运行MapReduce任务,Hbase是一种在Hadoop之上的NoSQL 的Key/vale数据库。这两种工具是可以同时使用的。就像用Google来搜索,用FaceBook进行社交一样,Hive可以用来进行统计查询,HBase可以用来进行实时查询,数据也可以从Hive写到HBase,或者从HBase写回Hive。

   -----------------------------------------------------------------------------------------------

好了,文章内容到这里就结束了。如果各位有更多好的观点,欢迎各位读者分享给小编。我们下期见
我是小哪吒,传智专修学院的一名学子。一名编程行业的业余选手…哈哈哈

成功需要朋友,但巨大的成功需要敌人
相关标签: 大数据 hbase