欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

SSAS的转了别人的日记2

程序员文章站 2024-02-18 08:13:34
...

1. 创建数据源(必须的) 把项目中可能用到的数据仓库的连接设置好 通常是数据仓库 注意:身份模拟的设置 如果仓库和SSAS是一个服务器,可以直接使用服务帐号 否则,可以指定特定的用户名和密码 2. 创建数据源视图(必须的) 把项目中可能用到的一些维度表和

1. 创建数据源(必须的)
把项目中可能用到的数据仓库的连接设置好
通常是数据仓库
注意:身份模拟的设置
如果仓库和SSAS是一个服务器,可以直接使用服务帐号
否则,可以指定特定的用户名和密码

2. 创建数据源视图(必须的)
把项目中可能用到的一些维度表和事实表映射成一个视图
经验做法:先选择事实表,然后“添加相关表”

还可以做一些附加的操作
修改友好名称
添加命名计算(在原先的数据库字段基础上,再派生一些字段)
修改关系(如果仓库中没有关系,可以通过在这里建立关系来实现)
如果表仍然比较多,可以通过创建不同的视图来简化
3. 创建多维数据集
两种主要的模型:
根据仓库自动生成(最方便)
选择数据源视图
选择事实表和维度表

重点要修改的地方
多维数据集结构
修改度量值的聚合方式
修改度量值的格式


维度用法(维度和度量的关系)
常规:维度和事实是标准的一对多关系
事实关系:退化维度(某些要分析的方面,它的数据增长与度量值基本接近,此时不适合做维度表)与度量值的关系。
多对多关系:针对仓库中的多对多关系的一个实现。需要中间事实表
被引用关系:雪花架构的产物。需要中间维度


部署:将定义发送给服务器,创建多维数据库
处理:把数据从仓库中读取出来,并且根据多维数据集的定义和维度定义进行预先计算


先建模,然后反向工程生成仓库


4. 理解维度的设计
维度的属性(Attribute)来自于维度表中的字段
Attribute的值应该要能唯一标识自己,否则就可能出现聚合错误
通过添加KeyColumn,让它变成复合键。
层次结构
方便用户分析
提供更好的效率

将一些低级别的Attribute隐藏起来

Attribute的关系问题
默认情况下,所有的Attribute都与维度的键列发生直接关系
如果有创建层次结构的话,建议在层次结构属性之间创建关系,这样就会有一些属性与键列发生间接关系

5. 多维数据库设计的进阶知识
5.1 计算
可以做三个事情
计算成员:是在聚合值的基础上再做计算。此处一定要注意与命名计算的区别。根本区别在于命名计算是针对行集的(语法上T-SQL),每一行都要计算。计算成员是针对聚合之后的结果计算。(语法是MDX). 相当于是一个标量函数,永远返回一个值。

计算成员通常是针对度量值的计算,最后还是归类在度量值中。

命名集:也用MDX脚本,定义一个表达式,返回值可能是多个的。例如,我们可以将经常需要分析的产品(例如有10个)定义为一个所谓的“核心产品”

命令集通常是针对维度的筛选。


脚本命令:可以改变MDX计算的结果,甚至可以产生虚构的数据。

5.3 KPI
关键性能指标
提供了4个表达式(MDX),来定义四个信息
目标:MDX查询得到目标指标值
当前:MDX查询得到实际完成值
状态:一般都是比较目标和当前值,得到的结果一般是三个值:1,0,-1

走向:通常也是比较当前值与历史一段时间的值,得到结果也是1,0,-1

5.4 操作(action)
希望在分析界面中,提供其他的一些链接,报表,钻取
但是,Action需要怎么在客户程序展现,依赖我们的代码去实现(Excel中已经实现了)

5.5 分区(partition)
规划数据存储设计。针对大型的分析数据库,必须规划多分区,以提高处理速度和查询效率。
分区之后,首先可以简化处理。可以针对单个分区进行处理,这样大大地提高处理速度。
如果有多分区,查询的时候,可以并行操作。

先把默认分区的绑定方式,从表绑定改成查询绑定。通常查询条件中,我们都是用时间列作为条件区分。
再去创建新的分区。


5.6 透视
针对一个cube,可以做多个透视。每个透视其实很类似于视图
5.7 翻译
针对一个cube,可以支持多个语言版本