欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Hive基本概念 博客分类: Hive Hive 

程序员文章站 2024-03-15 12:15:11
...
一 什么是Hive
Hive是构建于Hadoop HDFS之上的一个数据仓库,它本身就是一个数据库。
 
二什么是数据仓库
数据仓库就是一个数据库,数据仓库是一个面向主题的、集成的、不可更新的、随时间不变化的数据集合,它用于支持企业或组织的决策分析处理。
面向主题:数据仓库中的数据是按照一定的主题进行组织的,是用户进行决策时关注的重点方面。例如商品推荐系统,主题当然是商品信息。
集成的:数据仓库中的数据时来自分散的操作性数据,将操作性地数据从原来的数据中抽取出来,进行加工处理,满足一定的条件才能进入数据仓库。原来的数据可以来自于oracle数据库或Mysql数据库,也可以来自一个文本文件或者来自其他系统。我们把不同的数据集成起来,就形成了数据仓库。
不可更新的:主要是用来数据查询,不会在数据仓库中进行更新或删除。
 
三 数据仓库的结构和建立过程

Hive基本概念
            
    
    博客分类: Hive Hive 
 
 
四 OLTP应用
1、定义
OLTP:联机事务处理
2、典型应用
银行转账

Hive基本概念
            
    
    博客分类: Hive Hive 
 
 
五 OLAP应用
1、定义
OLAP:联机分析处理
2、典型应用
商品推荐系统

Hive基本概念
            
    
    博客分类: Hive Hive 
 
 
六 数据仓库中的数据模型

Hive基本概念
            
    
    博客分类: Hive Hive 
 
1、星型模型

Hive基本概念
            
    
    博客分类: Hive Hive 
 
2、雪花模型

Hive基本概念
            
    
    博客分类: Hive Hive 
 

 

 
  • Hive基本概念
            
    
    博客分类: Hive Hive 
  • 大小: 188.3 KB
  • Hive基本概念
            
    
    博客分类: Hive Hive 
  • 大小: 100.9 KB
  • Hive基本概念
            
    
    博客分类: Hive Hive 
  • 大小: 164.3 KB
  • Hive基本概念
            
    
    博客分类: Hive Hive 
  • 大小: 162.7 KB
  • Hive基本概念
            
    
    博客分类: Hive Hive 
  • 大小: 43.9 KB
  • Hive基本概念
            
    
    博客分类: Hive Hive 
  • 大小: 103.4 KB
相关标签: Hive