欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

AIX系统的非计算内存最大值设置过大导致Oracle数据库有些不能连接上

程序员文章站 2022-05-27 09:15:45
...

AIX系统、Oracle数据库以及其监听器都没有做任何的修改,发现连接远程的数据库,有时可以连接上,有时连接不上数据库。

错误描述:

AIX系统、Oracle数据库以及其监听器都没有做任何的修改,发现连接远程的数据库,有时可以连接上,有时连接不上数据库。

1、连接不上数据库时:回报ORA-12537:TNS连接己关闭

2、发现alert_SID.log没有发现错误

3、查看$ORACLE_HOME/network/log/listener.log日志错误如下:

25-MAY-2010 18:54:26 * (CONNECT_DATA=(SERVICE_NAME=testoms)(CID=(PROGRAM=D:\项目资料\plsqldev\plsqldev.exe)(HOST=89587D60816246E)(USER=Administrator))) * (ADDRESS=(PROTOCOL=tcp)(HOST=10.88.22.77)(PORT=4954)) * establish * testoms * 12518

TNS-12518: TNS:listener could not hand off client connection

TNS-12547: TNS:lost contact

TNS-12560: TNS:protocol adapter error

TNS-00517: Lost contact

IBM/AIX RISC System/6000 Error: 32: Broken pipe

原因分析:

连接数据库,有时可以连接,有时连接不上。

用ping数据库ip -t 发现网络很稳定

一般出现上面的ora-12537错误,一般是因为数据库的listener.ora文件没有配置好,导致这样的错误。但没有改变过该文件,,原来连接数据库一直很正常,突然发现有时能连接有时不能连接的现象。

用lsnrct status查看该监听正常。

该库为测试库,尝试了关闭数据库,再启动

>shutdown immediate 关闭正常

但启动时出现下面的错误

SQL> startup

Could not load program oracletestoms:

Could not load module /usr/lib/libperfstat.a(shr_64.o).

Dependent module liblvm.a(shr_64.o) could not be loaded.

Could not load module liblvm.a(shr_64.o).

System error: Not enough space

Could not load module oracle.

Dependent module /usr/lib/libperfstat.a(shr_64.o) could not be loaded.

Could not load module .

ORA-12547: TNS:lost contact

再次启动的错误又不一样:

SQL> startup

ORA-00443: background process "MMAN" did not start

感到这是AIX系统出现的问题,查看下交换空间

omstestdb:/> lsps -a

Page Space Physical Volume Volume Group Size %Used Active Auto Type

Could not load program /usr/bin/sed:

Dependent module libc.a(shr.o) could not be loaded.

Could not load module libc.a(shr.o).

Could not load program /usr/bin/awk:

Dependent module libc.a(shr.o) could not be loaded.

Could not load module libc.a(shr.o).

0517-041 lsps: Cannot list paging space .

提示不能列出交换空间的大小,从这可以知道这是由于AIX的内存耗尽。

用topas查看目前的AIX查看内存及其交换空间的使用情况。

AIX的comp(计算内存)使用了4 GB,而nocomp(非计算内存)也使用了4GB,而交换空间则有很多的空闲。系统总共8GB的内存,而oracle中内存一般使用comp内存。而oracle的缓存则使用nocomp,有很多sql语句一直没有释放,使用了4GB的内存,而AIXnocomp的最大值也为4GB,导致内存不足。

限制AIX的nocomp(非计算)内存最大值。

把AIX的

minperm% = 20

maxclient% = 80

maxperm% = 80

调整更低。

解决步骤:

查看原来的AIX的minperm%、maxclient%、maxperm%的值。如下:

Root用户查看:

>vmo –a

minperm% = 20

maxclient% = 80

maxperm% = 80

把minperm%设置成10,maxclient%设置成20,maxperm%设置成20

用root命令行执行:

1、

vmo -p -o minperm%=10

2、

vmo -p -o maxclient%=20

3、

vmo -p -o maxperm%=20

执行上面的操作,AIX的nocomp还不能释放内存,重启了AIX系统

# reboot

重启之后,重启oracle以及监听器

SQL>startup

$lsnrctl start

启动数据库及其监听器均正常,连接数据库则正常。

备注:

minperm 和 maxperm 参数的值

操作系统通过把在曾经读写的内存页留在实内存一满足不同要求。如果文件页面在它们的页帧被重新分配前被请求,那就节省了输入输出操作。该文件页面可以来自本地的或远程的(如 NFS)系统。

页帧使用的文件相对用于计算的(工作或程序文本)段的文件的比例是松散地受控于 minperm 和 maxperm 的值的:

如果 RAM 中文件页面所占的百分比高于 maxperm,页面替换的窃取只用于文件页。

如果 RAM 中文件页面所占的百分比低于 minperm,页面替换的窃取同时用于文件页和计算页。

如果 RAM 中文件页面所占的百分比介于 minperm 和 maxperm之间,页面替换只窃取文件页,除非文件页的重调入数量大于计算页数。

其中Noncomp在20%-80%之间,此时内存页交换算法通常只交换文件缓存页,但如果文件缓存页的交换率大于程序页时,程序页也同样被交换。由于SGA属于Comp页,数据文件缓存属于Noncomp页,而在数据大量访问时,文件缓存页的交换率大于程序页(SGA),因此大量的SGA页面被交换;为避免大量SGA页被交换,需要降低maxperm%值到35%以下,这样就只有文件缓存页面被交换,减少了SGA交换的次数。

AIX系统的非计算内存最大值设置过大导致Oracle数据库有些不能连接上