欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

基于nagios的监控环境(五):用Ndoutils将监控信息存库 博客分类: Linuxnagios centoslinuxnagiosndoutil 

程序员文章站 2024-02-28 21:14:04
...

一、安装步骤

1、Ndoutils安装

Monitoring
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
#【NDOUtils安装】
cd /home/taolei/copy/pkg/
tar zxvf ndoutils-2.0.0.tar.gz
cd ndoutils-2.0.0
 
#
# 做好MySQL库文件lib和include文件的连接(这点很重要)。
#这里要说明以下mysql的库文件路径,由于不同的安装方式,mysql的安装路径也不相同,
且需要安装mysql-devel,c才会有库文件
yum install mysql-devel
#这里要注意mysql的include文件夹路径,根据不同的方式安装可能不同
ln -sf /var/lib/mysql/include/* /usr/include/
mkdir /usr/include/mysql
ln -sf /var/lib/mysql/include/* /usr/include/mysql/
ln -sf /var/lib/mysql/lib/* /usr/lib/
mkdir /usr/lib/mysql
ln -sf /var/lib/mysql/lib/* /usr/lib/mysql
 
./configure LDFLAGS=-L/opt/mysql/lib
# 执行完成后,注意向上看看打印出的信息,看看是否找到了MySQL的库文件和include文件。
make
cd src/
 
#
# 我的Nagios是4.0.8,所以拷贝的是ndomod-4x.o、ndo2db-4x,
如果你的是2.X.x请拷贝ndomod-2x.o、ndo2db-2x
cp ndomod-4x.o ndo2db-4x log2ndo file2sock /usr/local/nagios/bin
cd ../db
# 创建数据库nagios,使用root用户,密码是root
mysqladmin -u root -proot create nagios
./installdb -u root -p root -d nagios  -h localhost
# 拷贝配置文件
cd ../config
cp ndo2db.cfg-sample /usr/local/nagios/etc/ndo2db.cfg
cp ndomod.cfg-sample /usr/local/nagios/etc/ndomod.cfg
 
#复制后的文件可能并没有执行权限(如果以root用户安装的话,文件是属于root的,
而nagios没有执行权限),为了让ndoutil能够通过该文件将监控信息存库,需要修改文件属主和权限
chown nagios:nagcmd /usr/local/nagios/etc/ndo2db.cfg
chown nagios:nagcmd /usr/local/nagios/etc/ndomod.cfg
chmod 744 /usr/local/nagios/etc/ndo2db.cfg
chmod 744 /usr/local/nagios/etc/ndomod.cfg
# 修改/usr/local/nagios/etc/ndo2db.cfg文件的数据库信息。
#db_user=root   db_pass=root  分别改为数据库的用户名和密码
#db_name=nagios 默认为nagios,如果在上面创建数据库时数据库名不为nagios,
此处也需做出相应的修改
nano /usr/local/nagios/etc/ndo2db.cfg
nano /usr/local/nagios/etc/nagios.cfg
# 复制下面内容粘贴到/usr/local/nagios/etc/nagios.cfg配置文件的#broker_module=...下面。
# Uncomment the line below if you're running Nagios 4.x
broker_module=/usr/local/nagios/bin/ndomod-4x.o config_file=/usr/local/nagios/etc/ndomod.cfg
# 修改/usr/local/nagios/etc/nagios.cfg配置文件下面参数的值为-1(一般默认如此)。
#event_broker_options=-1
 
#至此,ndoutils安装完成,需要对ndoutils进行一些配置,使其将监控信息存入指定数据库,
配置方法见下方【ndoutils配置】
# 启动ndo2db(这里)
/usr/local/nagios/bin/ndo2db-4x -c /usr/local/nagios/etc/ndo2db.cfg
 
# 查看系统日志是否有错误信息:
tail -5 /var/log/messages
Nov  7 00:57:46 localhost nagios: wproc: Core Worker 18303: job 34 (pid=25076): Dormant child reaped
Nov  7 17:01:39 localhost kernel: hpet1: lost 1 rtc interrupts
Nov  7 17:01:39 localhost nagios: Warning: A system time change of 57588 seconds (0d 15h 59m 48s forwards in time) has been detected.  Compensating...
Nov  7 17:01:58 localhost nagios: wproc: Core Worker 18302: job 41 (pid=25177) timed out. Killing it
Nov  7 17:01:58 localhost nagios: wproc: Core Worker 18302: job 38322480 with pid 25177 reaped at timeout. timeouts=2; started=42

2、ndoutils配置

2.1 mysql在本地机的配置

注:由于本地机也可以看作ip为127.0.0.1的远程机器,所以,配置方式也可以参考下方远程机的配置

编辑ndo2db.cfg配置文件

nano /usr/local/nagios/etc/ndo2db.cfg

lock_file=/usr/local/nagios/var/ndo2db.lock
ndo2db_user=nagios #nagios安装时的用户
ndo2db_group=nagcmd  #nagios安装时的用户组,官方文档里的安装步骤是nagcmd,
要核对清楚否则后面会导致一些权限问题
socket_type=unix  #使用本地机数据库用unix就好
socket_name=/usr/local/nagios/var/ndo.sock  #这个可以不改,socket_type=unix时才生效
tcp_port=5668 #这个可以不改,socket_type=tcp时才生效
use_ssl=0  #这边默认就行
db_servertype=mysql #数据库类型,暂时只支持mysql,虽然还可以配置为 pgsql = PostgreSQL
但是这个部分功能暂时还不全面,不建议配置
db_host=localhost #mysql所在机器名/IP,由于是本地机数据库,所以写为localhost
db_port=3306 #mysql数据库服务端口
db_name=nagios  #mysql中的数据库名
db_prefix=nagios_  #mysql库中表明的前缀,一般是nagios 如果扩展了cacti,那前缀可能是npc_
db_user=nagios  #mysql用户名
db_pass=root #mysql密码
max_timedevents_age=1440
max_systemcommands_age=10080
max_servicechecks_age=10080
max_hostchecks_age=10080
max_eventhandlers_age=44640
max_externalcommands_age=44640
debug_level=0
debug_verbosity=1
debug_file=/usr/local/nagios/var/ndo2db.debug
max_debug_file_size=1000000

 

编辑ndomod.cfg配置文件

nano /usr/local/nagios/etc/ndomod.cfg

instance_name=default  #这里可以自定义名称
output_type=unixsocket  #这里需要和ndo2db中的socket_type对应
output=127.0.0.1    #这里及后面的参数,入没有特殊必要,不建议修改,默认就行
tcp_port=5668  
use_ssl=0
output_buffer_items=5000
buffer_file=/usr/local/nagios/var/ndomod.tmp
file_rotation_interval=14400
file_rotation_timeout=60
reconnect_interval=15
reconnect_warning_interval=15
data_processing_options=-1
config_output_options=2

2.2 mysql在远程机的配置

编辑ndo2db.cfg配置文件

nano /usr/local/nagios/etc/ndo2db.cfg

lock_file=/usr/local/nagios/var/ndo2db.lock
ndo2db_user=nagios #nagios安装时的用户
ndo2db_group=nagcmd  ##nagios安装时的用户组,官方文档里的安装步骤是nagcmd,
要核对清楚否则后面会导致一些权限问题
socket_type=tcp   #使用远程机上的数据库这里需要改成tcp
socket_name=/usr/local/nagios/var/ndo.sock  #这个可以不改,socket_type=unix时才生效
tcp_port=5668 #这个可以不改,socket_type=tcp时才生效,一般默认5668,酌情修改
use_ssl=0  #这边默认就行
db_servertype=mysql #数据库类型,暂时只支持mysql,虽然还可以配置为 pgsql = PostgreSQL
但是这个部分功能暂时还不全面,不建议配置
db_host=localhost #mysql所在机器名/IP,我只试过远程机ip,远程机名称没试过。
db_port=3306 #mysql数据库服务端口
db_name=nagios  #mysql中的数据库名
db_prefix=nagios_  #mysql库中表明的前缀,一般是nagios 如果扩展了cacti,那前缀可能是npc_
db_user=nagios  #mysql用户名
db_pass=root #mysql密码
max_timedevents_age=1440
max_systemcommands_age=10080
max_servicechecks_age=10080
max_hostchecks_age=10080
max_eventhandlers_age=44640
max_externalcommands_age=44640
debug_level=0
debug_verbosity=1
debug_file=/usr/local/nagios/var/ndo2db.debug
max_debug_file_size=1000000

 

编辑ndomod.cfg配置文件

nano /usr/local/nagios/etc/ndomod.cfg

instance_name=default  #这里可以自定义名称
output_type=tcpsocket  #这里需要和ndo2db中的socket_type对应
output=127.0.0.1    #虽然是将监控信息存入远程数据库,但是这里的output含义不是将信息直接存入
远程数据库,所以不要改成mysql远程机的IP
tcp_port=5668   #这里及后面的参数默认即可
use_ssl=0
output_buffer_items=5000
buffer_file=/usr/local/nagios/var/ndomod.tmp
file_rotation_interval=14400
file_rotation_timeout=60
reconnect_interval=15
reconnect_warning_interval=15
data_processing_options=-1
config_output_options=2

 

 

二、常见问题

1、不能启动服务

错误信息:Could not bind socket: Address already in use

解决方法:

1)删除 /usr/local/nagios/var/ 中的 ndo.sock

rm -rf /usr/local/nagios/var/ndo.sock

2)重启ndo服务

/usr/local/nagios/bin/ndo2db-4x -c /usr/local/nagios/etc/ndo2db.cfg

(一般删除了就没问题了,如果不行,查看端口5668,如下)

查看5668端口监听的进程信息,kill进程,步骤如下

 

[root@localhost  etc]# netstat -apn |grep 5668
tcp        0      0 0.0.0.0:5668                0.0.0.0:*                   LISTEN      1533/ndo2db        
[root@localhost etc]# kill -3 1533  #这里的1533是删除进程对应的id
[root@localhost etc]# /usr/local/nagios/bin/ndo2db-4x -c /usr/local/nagios/etc/ndo2db.cfg #再次启动ndo进程

 

 

2、不能将数据存入数据库

按上述步骤启动运行,没有错误.在存储监控信息时,数据库里没有存进数据.

错误日志1:

错误信息:Could not open data sink!..

查看系统日志,内有"Could not open data sink!..."错误提示.

系统日志如下:

tail -20 /usr/local/nagios/var/nagios.log
#.....
Nov 21 04:52:02 localhost nagios: ndomod: NDOMOD 2.0.0 (02-28-2014) Copyright (c) 2009 Nagios Core Development Team and Community Contributors
Nov 21 04:52:02 localhost nagios: ndomod: Could not open data sink! I'll keep trying, but some output may get lost...
Nov 21 04:52:02 localhost nagios: ndomod registered for contact data'
Nov 21 04:52:02 localhost nagios: ndomod registered for contact notification data'
Nov 21 04:52:02 localhost nagios: Event broker module '/usr/local/nagios/bin/ndomod-4x.o' initialized successfully.
Nov 21 04:52:02 localhost nagios: Successfully launched command file worker with pid 18576
#.....

原因是ndo2db.cfg 、ndomod.cfg 的属主和属组不正确,导致ndo2db没有读写权限

解决方法:

修改属组、属主(或直接修改文件权限)后即可解决.修改步骤如下:

cd /usr/local/nagios/etc/
ls -l
-rw-------. 1 root root 4825 Nov 21 04:51 ndo2db.cfg
-rw-------. 1 root root 5104 Nov 21 04:38 ndomod.cfg

 

#修改属组、属主(或直接修改文件权限)后即可解决

chown nagios ndomod.cfg
chown nagios ndo2db.cfg
chmod 744 ndo2db.cfg
chmod 744 ndomod.cfg

错误日志2:

系统运行一段时间后就无法继续将监控信息存入数据库,

错误信息:Still unable to connect to data sink,queue send error, retrying...

查看nagios及系统日志信息,报如下错误:
[root@localhost etc]# tail -50 /usr/local/nagios/var/nagios.log
[1416980768] ndomod: Still unable to connect to data sink. 28787 items lost, 5000 queued items to flush.
[root@localhost etc]# tail /var/log/messages
Nov 25 22:00:02 localhost ndo2db-4x: Message sent to queue.
Nov 25 22:00:02 localhost ndo2db-4x: Warning: queue send error, retrying...

解决方法:

修改内核参数文件:nano /etc/sysctl.conf将下列参数改大点,如:
kernel.msgmax = 131072000 (每个消息的最大size)
kernel.msgmnb = 131072000 (整个系统的最大数量的消息队列)
kernel.msgmni = 65536000 ((每个消息队列的最大字节限制,一个队列有多个消息)

 

错误日志3:

Error writing to data sink!  Some output may get lost.

三、数据库自动清理设置

为了防止数据库数据量过于庞大,ndo会定期对数据库进行清理(这个在配置文件中设置参数的地方有详细说明),如果在自己项目中希望长期保留数据库中的监控信息,可以对ndo配置文件中相应的参数进行修改,这里我暂且使用默认设置

编辑配置文件ndo2db.cfg:

nano /usr/local/nagios/etc/ndo2db.cfg

在TABLE TRIMMING OPTIONS下方有一些参数:

# Keep timed events for 24 hours
max_timedevents_age=1440
# Keep system commands for 1 week
max_systemcommands_age=10080
# Keep service checks for 1 week
max_servicechecks_age=10080
# Keep host checks for 1 week
max_hostchecks_age=10080
# Keep event handlers for 31 days
max_eventhandlers_age=44640
# Keep external commands for 31 days
max_externalcommands_age=44640
# Keep notifications for 31 days
max_notifications_age=44640
# Keep contactnotifications for 31 days
max_contactnotifications=44640
# Keep contactnotificationmethods for 31 days
max_contactnotificationmethods=44640
# Keep logentries for 90 days
max_logentries_age=129600
# Keep acknowledgements for 31 days
max_acknowledgements_age=44640

参数单位:秒