欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

MySQL 的 DW 解决方案(MySQL + Infobright)

程序员文章站 2024-01-22 10:45:28
...

随着 BI (DW) 在各个企业中重要性的不断提升,各个数据库厂家都希望能搭上这辆班车。这不,MySQL 也联合 Infobright 一起推出了开源的 数据仓库解决方案,而且是开源的。 其实现的各种DW该有的功能就不多说了,但是 Infobright 有一点非常吸引人的技术特点不

随着 BI (DW) 在各个企业中重要性的不断提升,各个数据库厂家都希望能搭上这辆班车。这不,MySQL 也联合 Infobright 一起推出了开源的 数据仓库解决方案,而且是开源的。

其实现的各种DW该有的功能就不多说了,但是 Infobright 有一点非常吸引人的技术特点不能不提,那就是以列为导向的架构设计。

以列为导向的架构设计是非常适合于DW应用场景的,对于大多数DW的分析场景中,实际关注的数据很多时候都只有那么一列或者少数几列的数据。所以在以列为导向的设计中,大部分的分析查询都只需要读取某一个(或者几个)表的几列,而不需要像传统以行为导向的数据库(或者存储引擎)那样需要扫描整个表的数据,这两者IO量的差距是非常大的。除了以列为导向的架构设计之外,Infobright 和很多其他的DW解决方案一样,也会进行数据压缩,而且由于其以列为导向的存储方式,压缩比率在很多情况下都会比以行为导向的存储方式更高,效果更理想。有人通过测试比较,常规的以行为导向的存储数据压缩比率较高的时候也就 3:1 左右,但是 Infobright 的却很容易就做到 10:1 的压缩比率。

此外,从MySQL 以及 Infobright 的官方报道中除了上述技术特点(或者说优势)之外,还有很多其他的被描绘的非常神奇的功能,如被称为 “知识网格” (Knowledge Grid) 的自我管理功能,完全不需要索引或者分区,神奇的自我查询优化器等等。

这里是官方给出的一张 Infobright 的架构图:

MySQL 的 DW 解决方案(MySQL + Infobright)

infobright architecture

感兴趣的朋友可以通过自行阅读其 技术白皮书 获取更多的细节