2020-09-29
达梦数据库集群
1 概述
达梦数据库集群分为:读写分离集群、共享存储集群DMDSC、完全对等无共享式集群DMMPP、分布式数据库DMTDD。读写分离集群主要通过数据守护的方式实现。共享存储集群DSC和大规模并行处理MPP集群分别采用主流数据库系统架构中的共享存储架构和完全对等不共享架构。分布式数据库DMTDD是基于DMDSC或DMMPP或单机架构结合分布式文件系统DFS构成。下面分别就每种集群的实现原理及使用场景进行描述。
2 读写分离集群
读写分离集群是基于即时归档或实时归档实现的高性能数据库集群,不但提供数据保护、容灾等数据守护基本功能,还具有读写操作自动分离、负载均衡等特性,读写分离集群最多可以配置8个即时备库或8个实时备库。
2.1实现原理
实现读写分离集群的基本思路是:优先将所有操作发送到备库执行,一旦备库执行报错,则发送到主库重新执行。通过备库“试错”这么一个步骤,自然地将只读操作分流到备库执行。并且,备库“试错”由接口层自动完成,对应用透明。
读写分离集群数据库连接创建流程:
- 用户发起数据库连接请求。
- 接口(JDBC、DPI 等)根据服务名配置(在dm_svc.conf 中进行配置)登录主库。
- 主库挑选一个有效即时备库的IP/Port 返回给接口。
- 接口根据返回的备库IP 和Port 信息,向备库发起一个连接请求。
- 备库返回连接成功信息。
- 接口响应用户数据库连接创建成功。
接口在备库上创建的连接是读写分离集群自动创建的;对用户而言,就是在主库上创建了一个数据库连接。下图以配置了两个备库的读写集群为例,说明了读写分离集群的连接创建流程。
2.2优势
降低主库的并发访问压力,进而提升数据库的吞吐量。
2.3劣势
高性能模式的读写分离集群不能保证主备库的查询结果是一致的,因为高性能模式中备库收到redo日志后马上响应主库,在备库上查询时有可能相关redo日志还没应用完。
事务一致模式的读写分离集群事务的响应时间会变长,因为事务一致模式要求备库在重演Redo日志完成后再响应主库。
用户可根据应用的特性及需求选择合适的模式。
2.4适用场景
适用于应用中只读操作的比例远大于Insert/Delete/Update 等DML操作和修改对象定义等DDL操作的比例。例如,应用系统中有很多报表类业务时就需要比较适合将数据库系统建成读写分离集群。
3.共享存储集群DMDSC
3.1实现原理
DMDSC集群由若干数据库实例(Instance)组成,这些实例间通过网络(MAL 链路)连接,通过一个特殊的软件(DMCSS,集群同步服务)的协助,共同操作一个数据库。从外部用户视角来看,他们看到的只是一个数据库。数据文件、控制文件等文件在集群中只有一份,所有节点平等地使用这些数据文件。这份数据一般放在共享存储上,每个服务器通过光纤连接到共享存储上。
3.2优势
- 高可用性,只要集群中有一个活动节点,就能正常提供数据库服务。
- 高吞吐量,多个节点同时提供数据库服务,有效提升集群的整体事务处理能力。
- 负载均衡,用户的连接请求被平均分配到集群中的各个节点,确保各个节点的负载大致平衡。
3.3劣势
数据文件、控制文件存储在集群系统中只有一份,存在单点故障的风险,需要结合其他方式进一步提高系统可用性。例如,在存储层实现存储双活,对数据库透明的方式在底层同时存储两份完全相同的数据文件和控制文件;或者为DM DSC集群配置1个或多个备库,在DM DSC主库故障时备库自动切换为主库提供服务。
3.4适用场景
当硬件成本预算不足同时又要求数据库系统有较高的可用性时,可以使用多个廉价PC服务器代替昂贵的小型机或大型机。
4.完全对等无共享式集群DMMPP
4.1实现原理
DMMPP是基于达梦数据库管理系统研发的完全对等无共享式集群组件,支持将多个DM数据库实例组织为一个并行计算网络,对外提供统一的数据库服务。DM MPP中的每一个DM数据库服务器实例作为一个执行节点,简称EP。客户端可连接任意一个EP节点进行操作,所有EP对客户来说都是对等的。DM MPP系统内每个EP只负责自身部分数据的读写,执行计划在所有EP并行执行,能充分利用各EP的计算能力及发挥各EP独立存储的优势。数据只在必要时通过DM的高速邮件MAL系统在EP间传递。
4.2优势
- TB/PB 级数据分析,支持数据的并行装载和操作的并行执行,能支持TB/PB 级数据分析。
- 支持绝大部分单机功能支持绝大部分的DM单机版功能,同时支持行、列存储,支持存储过程、触发器、索引、分区表、多媒体数据类型等。
- 高性价比,无需额外配置特殊软、硬件,性价比超高。
- 高可靠性,DM MPP与DM数据守护相结合,为MPP系统中的每个EP配置一个或多个实时备库,确保系统的高可靠性。
- 支持超大型集群,支持最多1024个EP,轻松组建超大型集群。
4.3劣势
与单机版相比,存在一定的局限,暂不支持部分功能。
4.4适用场景
在海量数据分析的应用场景,以极低的成本代价为用户提供高性价比的数据存储、处理、计算能力。当通信代价占整体执行代价的比例较小时,更能体现大规模并行处理的优势,随着系统规模的扩大,并行支路越多,优势越明显。
5.分布式数据库DMTDD
5.1实现原理
达梦透明分布式数据库由计算层、日志层、存储层和目录服务器构成。其中,日志层和存储层的各组件统称为分布式文件系统DFS。达梦透明分布式数据库架构如下图所示:
图4 达梦透明分布式数据库架构
达梦透明分布式数据库在分布式文件系统DFS基础上,将计算层部署为DMDSC集群、DM MPP集群或单机数据库的分布式数据库,即“DFS+DMDSC”、“DFS+DM MPP”或“DFS+单机”三种组织形式。其中,计算层部署为DMDSC是DMTDD中一种典型的应用场景。
5.2优势
达梦透明分布式架构除提供分布式计算架构特有的数据多副本、良好的横向扩展等能力外,相对于互联网厂商提供的分布式数据库技术方案,本架构还具有全SQL支持、完整的事务支持、与已有单机架构兼容,对应用透明等特点。
5.3劣势
整体架构复杂,使用过程中用户必须遵守多项使用规范。
5.3适用场景
适用于具有高并发、大规模数据存储、业务快速扩张等特征的业务
本文地址:https://blog.csdn.net/OOOguoli/article/details/108866050
上一篇: Storm与Spark、Hadoop三种统计框架对比
下一篇: Redis——面试题整理