数据仓库的定义 博客分类: 数据仓库
程序员文章站
2024-03-22 12:55:28
...
数据仓库的定义 数据仓库是一个面向主题的,集成的,相对稳定的,反应历史变化的数据查询决策系统。 面向主题: 操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分区,而数据仓库的数据 是按照一定的分析主题域进行组织。 主题是在较高层次上将企业信息系统中的数据进行综合,归类分析利用的一个抽象概念。 集成的: 是对多个分散的数据源的数据抽取,清理的基础上经过系统加工,汇总整理得到的。 必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致性全局信息。 相对稳定的: 数据面向查询决策,通常数据被长期保留下来,修改和删除的操作很少,通常只需要定期的加载 和刷新 反应历史变化的: 保存历史信息,系统记录了企业从过去某一时点到目前的各个阶段的信息。通过这些信息, 可以对企业的发展历程和未来趋势做出定量分析和预测。 ------------------------------------------------------------------------------------------- 数据仓库组成 数据库 ETL 数据展示工具 元数据 什么是数据仓库的元数据? 元数据是指描述数据的数据,即描述数据仓库内数据的数据。 包括ETL的抽取时间,源数据到目标表的映射等等此类描述数据。 ---------------------------------------------------------------------------------------- 数据仓库的设计步骤 包括 数据库的设计 ETL设计 数据展现设计 数据库设计: 1.根据分析的主题确定数据源。 2.数据库的层次设计 3.各层次目标表结构的设计,及索引分区策略。 ETL设计: 1.各层次表数据的抽取,转换,加载的策略。 数据展现设计: 1.复杂表格或者图形化展示 2.数据查询范围限制,权限设置。
推荐阅读
-
dwr使用笔记 博客分类: 我的文档中心 DWRServletBeanSpringHibernate
-
数据仓库的定义 博客分类: 数据仓库
-
Oracle 压缩表的一点测试 博客分类: Oracle 优化
-
在Flex builder 3 中创作纯AS的AIR项目 博客分类: flex
-
动手开发自己的mvc (系列) 博客分类: java综合实现自己的MVC
-
回归分析定义衡量标准 博客分类: 机器学习
-
动手开发自己的mvc-3----容器该帮我们做什么?(非常的重点) 博客分类: 实现自己的MVCjava综合
-
怎样通过词频得到这个词频的排序? 博客分类: java综合web算法技术杂文 信息检索搜索词频大规模齐普夫法则
-
机器学习的算法衡量指标 博客分类: 机器学习
-
相关系数与决定系数的关系 博客分类: 机器学习