欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

电商数据分析——基于hive数仓,实现大数据分析

程序员文章站 2022-05-27 22:01:31
...

1. 需求

以电商数据为基础,结合hive数仓,实现大数据分析。

数据源可通过日志取得,数据清洗转换导入数据仓库,通过数仓中数据分析得到数据总结,用于企业决策。本项目基于以下表类进行电商数仓分析,分用户信息、用户订单日志、商品信息、商品种类

用户信息

    1,jake,男,15390809998,24
	2,tom,男,15279975648,22
	3,rose,女,14590809887,18
	4,mike,男,18978872134,24
	5,lili,女,17568949931,21
	6,john,男,19198578874,22

注意:

第一项:用户编号

第二项:名字

第三项:性别

第四项:手机号码

第五项:年龄

用户订单日志

2539329,1,1,2020-12-11,36.7.255.255,0,10001#10002#10003
2539330,1,2,2020-12-11,36.7.255.255,1,20001#10002
2539331,1,3,2020-12-21,36.7.255.255,0,10001#30001#20001#10003
2539332,2,1,2021-01-01,183.217.24.116,0,20003#30001
2539333,2,2,2021-01-06,183.217.24.116,0,10001#20001#20004
2539334,2,3,2021-01-10,183.217.24.116,1,30001#30002#20003#10002
2539335,2,4