欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

HIVE动态分区

程序员文章站 2022-07-06 10:39:45
...
set hive.exec.dynamic.partition=true;  -- 开启动态分区,默认是false
set hive.exec.dynamic.partition.mode=nonstrict; -- 开启允许所有分区都是动态的,否则必须要有一个静态分区才能使用

-- 创建分区表
create table test(id int ,name string )
partitioned by(ct string); -- 分区字段为ct

-- 向分区表中插入数据(动态分区的方式)

insert overwrite table test
partition(ct)
select id ,name,city from test_partiton;

说明:select了两个字段,前两个字段为表结构,最后一个默认为分区字段,注意select的顺序,分区字段应该在后面
insert...select 往表中导入数据时,select的字段个数必须和目标的字段个数相同,不能多,也不能少,否则会报错。如果字段的类型不一致的话,则会使用null值填充,不会报错。而使用load data形式往hive表中装载数据时,则不会检查。如果字段多了则会丢弃,少了则会null值填充。同样如果字段类型不一致,也是使用null值填充。

create table test_table as select * from table_one

注意CTAS创建表不能复制源表的默认值(主键、分区等),只是复制了字段名,类型和数据

create like 可以复制表结构和默认值,但是不会有源数据

hive建表

CREATE TABLE IF NOT EXISTS employee(
eid int comment "主键", 
name string,
salary string,
destination string
hobby array<string>
add map<String,string>)
COMMENT ‘Employee 表’
PARTITIONED BY (‘dt’ string COMMENT '时间做分区') -- 分区字段
ROW FORMAT DELIMIPTED
FIELDS TERMINATED BY ‘,’ -- 列分隔符 ,
LINES TERMINATED BY ‘\n’ -- 行分隔符 回车
MAP KEYS TERMINATED by ':' -- map
STORED AS TEXTFILE; -- 默认存储为文本格式

 

相关标签: hive 分区