欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

数据湖之iceberg系列(四)-hive处理iceberg中的数据

程序员文章站 2022-03-08 11:55:08
...

1 将iceberg-hive-runtime-0.10.0.jar包添加到hive的lib包下 , 或者是在客户端使用add jar 添加到项目中 

2 设置参数  / 或者在hive-site.xml中设置

3  读取catalog为hadoop的表中的数据 , 需要完成hive表和hadoop表的映射 

SET engine.hive.enabled=true; 
SET iceberg.engine.hive.enabled=true ;
CREATE EXTERNAL TABLE tb_user2
STORED BY 'org.apache.iceberg.mr.hive.HiveIcebergStorageHandler' 
LOCATION 'hdfs://linux01:8020/doit/iceberg/warehouse/logging/tb_user2';

select * from tb_user2 ; 可以查询到存储在iceberg中的hadoop类型的数据!

4 直接切换创的类型为hive的catalog数据库 , 直接读取表中的数据  

需要设置如下参数 :

 
SET iceberg.mr.catalog=hive;  **** 读取生成的iceberg表中的数据 
数据湖之iceberg系列(四)-hive处理iceberg中的数据

 

 

相关标签: 数据湖