欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

python脚本监控logstash进程并邮件告警实例

程序员文章站 2023-10-31 15:38:04
supervisor虽然也能拉起来logstash进程,但是有时候supervisor也会挂,也有时会拉不起,就算拉起来了也没有邮件告警功能 ,所以编写一个python脚本监控所有服务器,以下代码只列...

supervisor虽然也能拉起来logstash进程,但是有时候supervisor也会挂,也有时会拉不起,就算拉起来了也没有邮件告警功能 ,所以编写一个python脚本监控所有服务器,以下代码只列举了一台服务器,需要更多服务器在列表里面添加就行!

(日志采集过程中连续几天数据异常,由于服务器太多,当时不太想一一去将近40台服务器查看logstash进程,但又一直查不出原因,后来就每台服务器查看logstash进程,果然发现3台采集搜索日志的logstash进程没了,然后就编写了此脚本监控,效果很好)

# coding=utf-8
#!/usr/bin/env python
_author_ = 'liuzc'
import os
import datetime
import smtplib
from email.mime.text import mimetext
from email.header import header
# 定义日志输出文件
log = "/home/data/liuzc/check_ps/logstash_process.log"
ipandurllist = [
  ["log@10.10.10.10","aiu-service-agent.conf"]
]
def checkps():
 begintime = datetime.datetime.now()
 print("开始检查进程。。。时间为:%s" % begintime)
 for ipandurl in ipandurllist:
  ip = ipandurl[0]
  configname = ipandurl[1]
  alist = ip.split("@")
  username = alist[0]
  #将进程信息写入log文件
  os.system("ssh %s ps -ef |grep %s |grep -v 'grep'> %s" %(ip,configname,log))
  #判断文件大小,当logstash没有运行时上一步写入log的内容为空
  if not(os.path.getsize(log)):
   # 重启进程
   print("ip为%s,配置文件名称为 %s 不在进程中,正在重启进程......" %(ip,configname))
   # os.system('ssh %s /home/%s/elk/logstash/bin/logstash -f %s &'%(ip,username,url))
   os.system('ssh %s /home/%s/elk/logstash/bin/logstash -f /home/%s/elk/logstash/etc/%s &' % (ip, username,username, configname))
   print("重启进程成功,开始发送邮件")
   # 发送邮件
   sendmail(ip,configname)
 endtime = datetime.datetime.now()
 print("检查进程结束。。。时间为:%s" % endtime)
 print("=============================================================================")
 
def sendmail(ip,configname):
 # 当前时间
 now = datetime.datetime.now()
 # 第三方 smtp 服务
 mail_host = "mail.qq.com" # 设置服务器
 mail_user = "aa@qq.com" # 用户名
 mail_pass = "deretrgt4556h" # 口令
 sender = 'aa@qq.com'
 receivers = ['bb@qq.com','cc@qq.com','dd@qq.com'] # 接收邮件,可设置为你的qq邮箱或者其他邮箱
 message = mimetext('logstash进程异常,但已自动重启...服务器为 %s , 配置文件为 %s , 时间为 %s ' %(ip,configname,now), 'plain', 'utf-8')
 message['from'] = header("logstash_ps", 'utf-8')
 message['to'] = header("users", 'utf-8')
 subject = 'logstash进程异常告警!!!'
 message['subject'] = header(subject, 'utf-8')
 try:
  smtpobj = smtplib.smtp()
  smtpobj.connect(mail_host, 25) # 25 为 smtp 端口号
  smtpobj.login(mail_user, mail_pass)
  smtpobj.sendmail(sender, receivers, message.as_string())
  print ("邮件发送成功!!!")
 except smtplib.smtpexception:
  print("error: 邮件发送失败。。。")
 
if __name__ == '__main__':
 while true:
  try:
   checkps()
  except exception as e:
   print('error:', e)
 

以上这篇python脚本监控logstash进程并邮件告警实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。