wordcount经典题:使用Hive完成单词统计
程序员文章站
2022-03-08 14:24:04
...
- 准备数据
- 在hive创建数据库、表、导入数据
create database interview; #创建数据库
use interview; #使用数据库
create table wordcount(line string); #创建单词统计表(这里表中一行的数据是文档中的一行的字符串)
load data local inpath '/home/data/wordcount' overwrite into table wordcount; #加载数据
create wordsingle(word string); #创建表用于一行存放一个单词
insert into table wordsingle select explode(split(line," ")) as w from (select line from wordcount)as line; #将wordcount表中的单词打散,一个个存放
select word,count(word) as con from wordsingle group by word; #统计
上一篇: hive内部表和外部表&&LIKE 复制
下一篇: hive学习(十一)------权限管理