电商数据分析——基于hive数仓,实现大数据分析
程序员文章站
2022-05-27 22:01:31
...
1. 需求
以电商数据为基础,结合hive数仓,实现大数据分析。
数据源可通过日志取得,数据清洗转换导入数据仓库,通过数仓中数据分析得到数据总结,用于企业决策。本项目基于以下表类进行电商数仓分析,分用户信息、用户订单日志、商品信息、商品种类
用户信息
1,jake,男,15390809998,24
2,tom,男,15279975648,22
3,rose,女,14590809887,18
4,mike,男,18978872134,24
5,lili,女,17568949931,21
6,john,男,19198578874,22
注意:
第一项:用户编号
第二项:名字
第三项:性别
第四项:手机号码
第五项:年龄
用户订单日志
2539329,1,1,2020-12-11,36.7.255.255,0,10001#10002#10003
2539330,1,2,2020-12-11,36.7.255.255,1,20001#10002
2539331,1,3,2020-12-21,36.7.255.255,0,10001#30001#20001#10003
2539332,2,1,2021-01-01,183.217.24.116,0,20003#30001
2539333,2,2,2021-01-06,183.217.24.116,0,10001#20001#20004
2539334,2,3,2021-01-10,183.217.24.116,1,30001#30002#20003#10002
2539335,2,4