HIVE动态分区
程序员文章站
2022-07-06 10:39:45
...
set hive.exec.dynamic.partition=true; -- 开启动态分区,默认是false
set hive.exec.dynamic.partition.mode=nonstrict; -- 开启允许所有分区都是动态的,否则必须要有一个静态分区才能使用
-- 创建分区表
create table test(id int ,name string )
partitioned by(ct string); -- 分区字段为ct
-- 向分区表中插入数据(动态分区的方式)
insert overwrite table test
partition(ct)
select id ,name,city from test_partiton;
说明:select了两个字段,前两个字段为表结构,最后一个默认为分区字段,注意select的顺序,分区字段应该在后面
insert...select 往表中导入数据时,select的字段个数必须和目标的字段个数相同,不能多,也不能少,否则会报错。如果字段的类型不一致的话,则会使用null值填充,不会报错。而使用load data形式往hive表中装载数据时,则不会检查。如果字段多了则会丢弃,少了则会null值填充。同样如果字段类型不一致,也是使用null值填充。
create table test_table as select * from table_one
注意CTAS创建表不能复制源表的默认值(主键、分区等),只是复制了字段名,类型和数据
create like 可以复制表结构和默认值,但是不会有源数据
hive建表
CREATE TABLE IF NOT EXISTS employee(
eid int comment "主键",
name string,
salary string,
destination string
hobby array<string>
add map<String,string>)
COMMENT ‘Employee 表’
PARTITIONED BY (‘dt’ string COMMENT '时间做分区') -- 分区字段
ROW FORMAT DELIMIPTED
FIELDS TERMINATED BY ‘,’ -- 列分隔符 ,
LINES TERMINATED BY ‘\n’ -- 行分隔符 回车
MAP KEYS TERMINATED by ':' -- map
STORED AS TEXTFILE; -- 默认存储为文本格式