如何监测和优化OLAP数据库
优化在线分析处理的性能是非常重要的,幸运的是,一些工具可以帮助监测和改善olap数据库的运行。
微软sqlserver分析服务(ssas)提供了一个用来创建和管理数据挖掘应用和在线分析处理系统的强大引擎,为了取得最佳的olap性能,你应该仔细的监测和优化olap数据库和潜在的关系数据源,本文介绍了监测ssas和优化olap性能的工具。
sqlserver profiler
你可以使用sql serverprofiler基于选择好的事件来捕获ssas实例的活动,sql server profiler以跟踪的方式来捕获活动并且包含了一套满足最常见的跟踪捕获场景的预定义的模板,可以将跟踪到的信息保存到一个文件或者是一个允许你实时监测数据的ssas的数据库中,也可以实时的或者是一步一步的在同一个或者是另一个ssas实例上重放跟踪,通过对跟踪进行重放,能够轻易地找到运行慢的多维表达式,或者是mdxes,比较不同环境下的性能基准进行测试和调试,你也能够使用sql server profiler对安全进行审核,比如说,可以设置用来审核失败的链接尝试或者是一个用户试图访问一个未经授权的对象时许可失败的跟踪文件,关于如何创建和运行跟踪的详细内容,请看为重放(分析服务)创建分析跟踪和分析服务跟踪事件。
系统监视器
监控本地和远程ssas实例和操作系统以及所运行的计算机性能的一个最常使用的工具是系统监视器,这是一个windows性能的实用组件,提供了近乎实时的仅被用来实时监控的性能信息,并且是被看作用来测量性能和识别硬件瓶颈的最好的工具之一,但是,你不能使用系统监视器来鉴定性能问题的原因,比如说,系统监视器也许显示高的cpu使用率,但是不会标识出原因;你可以从一个位置使用系统监视器来监控多个计算机,对于每一个需要监控的系统来讲可以减少资源占用,并且给了你一种直接比较不同计算机的性能统计的方法。
扩展事件和分析服务动态管理视图
扩展事件(xevents)是一个对系统资源占用非常少的一个高伸缩性和轻量级性能监视系统的事件基础架构,使用xevents,可以捕获针对所有 ssas事件给到指定的用户,xevents基础架构已经被直接集成到了sqlserver并且可以使用t-sql简单的进行管理,更多的信息请看sql server扩展事件。
分析服务动态管理视图(dmvs)是用来提供大量的关于分析服务实例状态和服务器健康信息的查询结构,使用这些信息能够诊断和调优分析服务实例或者是数据库性能,所有的dmvs都内置于$system中,关于使用dmvs监控分析服务的更多信息,请查看msdn资源。
以上是用来监测ssas和olap性能的工具,下面是优化olap应该考虑的地方。
使用索引
索引可以提高影响多维在线分析处理(molap)分区处理速度和关系在线分析处理(rolap)分区查询速度的基础数据库的查询性能,大部分分析服务数据库是只读的因此可以从索引中受益,一般的经验法则是创建覆盖所有分析服务执行的查询,另外,为了实现最佳的性能,你应该创建的所有索引应该使用100%的填充因子。
在基础数据库中成本消耗会关系到使用的索引,比如,更新数据的查询(insert, update或者delete)也一定会修改索引,因此,大量的索引会降低这些dml操作(insert,update or delete)的性能,但是,这个不会影响到一个只读系统,另外,索引会占用时间和磁盘空间,最好的做法是使用sql server profiler和数据库引擎优化向导或者和索引相关的dmvs和动态管理函数dmfs定期的分析查询和索引的使用,这样能帮助你发现需要创建的索引以及删除掉的索引。
选择适当的聚合
查询性能在很大程度上依赖于适当的聚合,但是没有必要在每一个维度的级别上添加聚合,当使用聚合设计向导(aggregation design wizard)或者是usage-based优化向导时,你应该从较低的值开始尝试不同的性能增益值,最初,当你提高了性能增益值时会注意到主要的查询速度的提高,尽管性能增益值提高了,也常常会有收益递减,每一次性能的提升使得磁盘空间的增长逐步升级,你也能够使用搜索日志来存储用户查询以备为将来分析使用,使用usage-based优化向导对查询日志数据优化聚合,你也能使用聚合设计向导创建适当的聚合,对于一个拥有较少或者是没有查询日志数据的新的系统来讲聚合设计向导是非常有用的,而当一个系统成熟时usage-based优化向导会产生较好的结果。
使用主动缓存
为了在查询olap数据库时达到较快的效果,你必须使用molap存储,但是,如果你使用了molap,因为它是周期性的处理数据的,所以数据会有一些延迟,为了获得最新的数据,你也必须使用rolap存储,但是rolap的存储性能要比molap在查询响应方面明显的慢,那就是主动缓存配置选项很有用的地方了,因为它允许分析服务可以从molap和rolap两边检索,因此为使用了rolap的最新数据的molap提供了效能,可以在msdn资源中发现更过的关于主动缓存的信息。
如何监测和优化olap数据库大家知道了吗?希望可以应用到大家的工作当中。