浅析Oracle体系结构
oracle的体系结构大体上分为两部分:instance(实例)和database(数据库)。
如图1所示:
图1 oracle 数据库体系结构
我们平时说的oracle server(oracle服务器)就是由 oracle instance 和 oracle database 组成的,如图2:
图2 oracle server
oracle instanceinstance中主要包含 sga 以及一些 backgroud process (后台进程)(例如:pmon、smon、dbwr、lgwr、ckpt等)。
sga
sga包含6 个基本组件:shared pool(library cache,data dictionary cache)、database buffer cache、redo log buffer、java pool、large pool、stream pool。
下面将分别介绍这6个基本组件的功能。
1) shared pool
- 共享池是对 sql、pl/sql 程序进行语法分析、编译、执行的内存区域。
- 共享池由 library cache(库缓存)、data dictionary cache(数据字典缓存)和 server result cache(结果缓存)等组成。
它们分别都有哪些作用呢?
library cache: sql 和 pl/sql 的解析场所,存放着经过编译解析后的sql和pl/sql语句的内容,以备所有用户共享。
* 如果下次再执行同样的 sql 语句的时候,就不需要解析了,立即从 library cache 获取执行。
* library cache的 size 会决定着编译解析 sql 语句的频度,从而决定了性能。
* library cache中又包含两部分内容:shared sql area和shared pl/sql area。
data dictionary cache: 存放重要的数据字典信息,以备数据库使用。
* data dictionary是使用最频繁的,几乎所有的操作都需要到数据字典去查询。为了提高访问data dictionary的速度,此时需要一个cache,需要的时候访问内存即可。
* data dictionary cache里面的信息包含了database files、tables、indexes、columns、users、privileges和其他的数据库对象。
server result cache: 存放服务器端的 sql 结果集及 pl/sql 函数返回值。
看了上面的讲解,或许会觉得有些抽象,下面将通过一个例子进行讲解。
假设在客户端提交一个命令,如下:
如果数据库是第一次被提交这条语句,则需要进行解析,解析过程分为硬解析和软解析。
- 硬解析:检查语法、语义、权限,分析绑定变量等,最终生成一个执行计划;
- 软解析:依据执行计划去具体执行它。若是select语句,执行完后还会返回结果集,若是update、delete语句则无需返回结果集。
library cache会把这条 sql 语句和执行计划装入其中。
装入这些东西有什么作用呢?
下次再敲一摸一样(标点符号、大小写、空格完全一致)的语句时,就不需要硬解析了。
小问答:
如果此时客户端再提交一条命令:
猜测一下,这条语句需要被解析吗?
答案:需要。
小说明:注意哦,语句必须完全一样才不需要解析哦。标点符号、大小写、空格等都要完全一致哦!平时规范书写的好处在这里就体现啦。
前面有说到,若是 select 语句,执行完后还会返回结果集。那结果集存放在哪里呢?
该语句执行返回的结果集将存放在 server result cache 中。
2) database buffer cache
- database buffer cache用于存储从磁盘数据文件中读入的数据,为所有用户共享。
- server process(服务器进程)将读入的数据保存在数据缓冲区中,当后续的请求需要这些数据时可以在内存中找到,则不需要再从磁盘读取。
小说明:逻辑读(从内存读)的速度是物理读(从磁盘读)的1万倍呦,所以还是想办法尽量多从内存读哦。
所以,数据缓冲区的大小对数据库的读取速度有直接的影响。
例如用户访问一个表里面的记录时,数据库接收到这个请求后,首先会在database buffer cache中查找是否存在该数据库表的记录,如果有所需的记录就直接从内存中读取该记录返回给用户(有效提升了访问的速度),否则只能去磁盘上去读取。
继续看上面的例子:
该条语句以及它的执行计划被放在library cache里,但语句涉及到的数据,会放在 database buffer cache 里。
小问答:
database buffer cache是怎么工作的呢?
这就要说一说database buffer cache的设计思想了。
磁盘上存储的是块(block),文件都有文件号,块也有块号。
若要访问磁盘上的块,并不是cpu拿到指令后直接访问磁盘,而是先把块读到内存中的database buffer cache里,生成副本,查询或增删改都是对内存中的副本进行操作。如图3所示。
另外,如果是增删操作,操作后会形成脏块,脏块会在恰当时机再写回磁盘原位置,注意哦,可不是立刻写回呦。
也许你会问,为什么不立刻写回呢?
因为:
(1)减少物理io;
(2)可共享,若后面又有对该块的访问,可直接在内存中进行逻辑读。
图3 访问数据块
小问答:
为什么要通过内存访问数据块,而不是cpu直接访问磁盘呢?
答:因为相较于cpu,io的速度实在是太慢了,cpu的速度是io 的100万倍呢?如果cpu直接访问磁盘的话,会造成大量的io等待,cpu的利用率会很低。所以,利用速度相当的内存(cpu速度为内存的100倍)做中间缓存,可以有效减少物理io,提高cpu利用率。
但是,这里会有一个问题。前面说到查询或增删改都是对内存中的副本进行操作,当增删改操作产生脏块时不会立刻写回磁盘。
小问答:
我们设想一下,如果在 database buffer cache 中存放大量未来得及写回磁盘的脏块时,突然出现系统故障(比如断电),导致内存中的数据丢失。而此时磁盘中的块存放的依然是修改前的旧数据,这样岂不是导致前面的修改无效?
要怎样保持事务的一致性呢?
答:如果我们能够保存住提交的记录,在 database buffer cache 中一旦有数据更改,马上写入一个地方记录下来,不就可以保证事务一致性了嘛。
小说明:instance在断电时会消失,instance在内存中存放的数据将丢失。这就需要 redo log buffer 发挥它的作用啦。
3)redo log buffer
- 日志条目(redo entries )记录了数据库的所有修改信息(包括 dml 和 ddl),一条redo entries记录一次对数据库的改变 ,为的是数据库恢复。
- 日志条目首先产生于日志缓冲区。日志缓冲区较小,它是以字节为单位的,它极其重要。
- 在database buffer cache中一旦有数据更改,马上写入redo log buffer,redo log buffer在内存中保留一段时间后,会写入磁盘,然后归档(3级结构)。
4)large pool(可选)
为了进行大的后台进程操作而分配的内存空间,与 shared pool 管理不同,主要用于共享服
务器的 session memory,rman 备份恢复以及并行查询等。
5)java pool(可选)
为了 java 虚拟机及应用而分配的内存空间,包含所有 session 指定的 java 代码和数据。
6)stream pool(可选)
为了 stream process 而分配的内存空间。stream 技术是为了在不同数据库之间共享数据,
因此,它只对使用了 stream 数据库特性的系统是重要的。
background process
在正式介绍 background process 之前,先简单介绍 oracle 的 process 类型。
oracle process 有三种类型:
- user proces
客户端要与服务器连接,在客户端启动起来的进程就是 user process,一般分为三种形式(sql*plus, 应用程序,web 方式(oem))。
- server process
user process 不能直接访问 oracle,必须通过相应的 server process 访问实例,进而访问数据库。
用户登录到 oracle server 就是 user process 和 server process 建立connection。
- background process
oracle instance的重要组成部分。接下来会对其做详细讲解。
小补充:
connection & session
connection是指一个oracle的客户端和后台和后台的进程(server process)建立的tcp连接。如图4所示:
图4 connection
connection 建立过程可简单描述如下:
1.首先建立 tcp 连接,oracle 对用户的身份进行认证、进行安全审计等等;
2.当这些都通过后, oracle 的 server process 才会允许客户端使用oracle提供的服务;
3.当 oracle 的连接建立起来以后,就意味着开始了一个 session (会话),当连接断开的时候这个会话就消失了。
session 是和 connection 相辅相成的。session信息会存储在 oracle 的 data dictionary 中。
可通过图5直观看出 connection 和 session 的区别。
图5 connection & session
background process(后台进程)主要包括:smon(系统监控器进程 )、pmon(进程监控器进程)、dbwr( 数据库写入程序进程)、lgwr(日志写入程序进程)、ckpt(检查点进程)。
1)pmon(process monitor)
pmon的主要作用如下:
- 监控各个oracle后台进程是否正常,发现异常的进程将其清除掉,重新生成该进程。
- (说明:当用户进程断掉时,server process 留着就没用了,但是还占着空间,pmon 会定时检查 server process ,如果和 user process 连接不上了,pmon 会把 server process 收回,把 pga 空间收回,里面的锁也收回。)
- 监控空闲会话是否到达阀值。
- 动态注册监听。
2)smon(system monitor)
smon的主要作用如下:
- 当oracle运行时突然宕机,下次启动需要实例恢复(instance recovery),smon负责实例恢复的全程监控;
- 当oracle运行时突然宕机,在下一次启动oracle instance的时候,它里面一些没有释放的资源会由smon进行清理;
- 一些事务失败的时候也由smon进行清理;内存空间很分散(不连续)时需要smon将这个分散的空间整合起来;
- 释放不再使用的临时段(segment)。
3)dbwr(database writer)
dbwn是oracle中工作最繁重的进程。主要作用如下:
- 将 database buffer cache 中的脏块(dirty buffer)写到 data file 中。
- 释放data buffer cache空间。
小说明:
如果数据库的负荷比较大,来自于客户端的请求比较多,存在大量的io操作,需要频繁的将缓冲区的内容写到磁盘文件上,那么这时就可以配置多个dbwn(一共oracle支持20个dbwn,dbw0-dbw9,dbwa-dbwg)。通常一个中小型的oracle只需要一个dbw0 process就可以了。
注意:以下几种情况发生时,都会触发dbwr process将 database buffer cache 的内容写到data files :
- checkpoint occurs
- dirty buffer reach threshold
- there are no free buffers
- timeout occurs
- rac ping request is made
- tablespace offline
- tablespace read only
- table drop or truncate
- tablespace begin
- backup
小补充:
服务器进程对数据文件执行读操作,而 dbwr 负责对数据文件执行写操作。
小问答:
commit 时 dbwr 有何动作?
答:什么也不做!
4)lgwr((log writer))
oracle instance中只有一个lgwr process,这个process的工作和dbwr process类似。主要作用如下:
将 redo log buffer 中的内容写入到 redo log files 中(必须在 dbwr 写脏块之前写入日志)。
(redo log buffer 是一个循环的buffer,对应的 redo log files 也是一个循环的文件组,从文件头开始写,当文件写满了,又会从文件头开始写,会把前面的内容覆盖掉,为了避免将 redo log files 覆盖掉可以选择将其写入到 archived redo log files 中。)
注意:以下几种情况发生时,都会触发lgwr process将 redo log buffer 中的内容写到 redo log files :
- at commit
- when one-third full
- when there is 1 mb of redo
- every three seconds
- before dbwn writes
怎么保证提交的事务永久保留呢?
答:已执行update操作为例 。
1. 当写提交语句的时候,修改已经写到 redo log buffer 里了;
2. 当看到返回提交成功时,说明修改已经写到磁盘 redo logfile 里了;
3. 所以提交成功后,改动已经同步到磁盘了,不会丢了。
5)ckpt(checkpoint)
ckpt的主要作用如下:
- 生成检查点, 通知或督促 dbwr 写脏块;
- *完全检查点:保证数据一致性。
- *增量检查点:不断更新控制文件中的检查点位置,当发生实例崩溃时,可以尽量缩短实例恢复的时间。在data file的在文件头更新检查点信息;在control file中更新检查点的信息。
6)arcn(archiver)
- arcn是一个可选的后台进程(几乎可看作必选进程)。
- oracle可以运行在两种模式下:archivelog mode(归档模式)、noarchivelog mode(非归档模式)。
- dba 必须做出的一个重要决策是,配置数据库在archivelog模式下运行,还是在noarchivelog模式下运行。
- 联机重做日志文件填满后,oracle实例开始写入下一个联机重做日志文件。
- 从一个联机重做日志文件切换到另一个联机重做日志文件的过程称为日志切换。
arcn的主要作用如下:
当oracle运行在归档模式时
- arcn进程在每次进行日志切换时都会开始对已填满的日志组进行备份或归档。
- arcn进程会在可以重新使用日志之前自动归档重做日志文件,因此会保留对数据库所做的所有更改。
这样,即使磁盘驱动器损坏,也可以将数据库恢复到故障点。
通过上面的学习,先把图1更新如下:
图6 oracle 数据库体系结构
database
database 其实就是由一堆物理文件组成的,主要是用于存储数据,database 中主要包含三种类型的文件:data files、control files、redo log files。
另外还有parameter file、password file、achieved log files等。
1)data files(数据文件)
data files 就是用于存储数据的,table 中的数据都是保存在 data files 中的。
2)control files(控制文件)
oracle为了操作data file,提供了一些 control files,这些 control files 主要是记录数据库的一些控制信息。
3)redo log files(重做日志文件)
redo log files 记录着数据库的改变,如果向数据库中放入数据或者是修改里面的数据,只要对数据库作了修改,那么就要将修改之前的状态、修改之后的状态都记录在 redo log files 中,其作用就是恢复data file。
* 例如:数据库有一个事务需要提交,但是提交失败了,事务就要回滚,那么事务回滚的依据就来自于这个 redo log files。redo log files 中记录着数据库的改变,关于这个事务的改变,如果需要回滚就需要把redo log files中的数据取出来,依照 redo log files 中的数据把 data files 恢复到修改之前的状态。
4)parameter file(参数文件)
任何一个数据库都必须要有参数文件,这个参数文件规定了oracle中的一些基本的参数、初始化的参数的值。
5)archived log files(归档日志文件)
archived log files 和 redo log files 是相辅相成的,redo log files 其实是一个反复利用的过程,会有几个(一般为3个)固定的文件,这些固定文件会被依次使用,用满了以后,oracle就会再次写这个文件头,就把以前的东西冲掉了。为了进一步加强数据库的备份恢复能力,在覆盖之前把这些修改的信息都归档到 archived log files 中。
6)password file(密码文件)
用户客户端连接到后台数据库系统时候存储口令的。
小问答:
instance 和 database 的对应关系是怎样的呢?
答:instance :database = n :1
1个 instance 只能属于1个数据库,可以多个 instance 同时访问1个数据库。
小补充:
oracle 的内存结构(memory structure)
oracle 的 memory structure 实际上包含两部分内容:sga和pga
sga(system global area系统全局区)
- 一个 oracle instance 对应一个sga,sga 在oracle instance启动的时候被分配,sga 是oracle instance 的基本组成部分。
- 一个 oracle instance 仅有一个 sga,sga是一个非常大的内存空间,甚至可以占据物理内存的80%。
pga(program global area程序全局区)
- 一个 server process 启动的时候就会分配一个 pga。在 oracle instance 中 pga 可能会很多。例如启动10个server process就会有10个pga。
- pga 存放用户游标、变量、控制、数据排序、存放 hash 值。
- 与 sga 不同,pga 是独立的,非共享。是分配给一个进程并归该进程私有的内存区域。
到此这篇关于oracle体系结构的文章就介绍到这了,更多相关oracle体系结构内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
上一篇: 手抓饼煎几分钟能熟
下一篇: 荀彧忠于汉室,为什么他不去辅佐刘备呢?