欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

【浅谈守护进程】Demo:后台监控程序-- Python实现

程序员文章站 2022-07-14 12:04:32
...

前言

最近在做的项目需要定期检测某个进程是否运行,若挂了自动重启,脑袋一拍觉得需要这样一个守护进程 来进行监控,于是顺便复习了一下守护进程。

正文

什么是守护进程?

守护进程(daemon)是生存期长的一种进程。它们常常在系统引导装入时启动,仅在系统关闭时才终止。因为它们没有控制终端,所以说它们是在后台运行的。
—–《APUE》

我们需求就是默默地定期执行任务 与守护进程非常的匹配。

编写一个守护进程


守护进程需要

  1. 设置文件模式创建屏蔽字。
  2. 没有控制终端。
  3. 确定工作目录。
  4. 关闭不再需要的文件描述符。
  5. 告别标准输入输出

如何实现

文件模式屏蔽字

只需要通过umask() 即可,由继承(至于为什么是继承,请看后面)得到的文件模式创建屏蔽字可能已经被修改为拒绝某些权限,所以我们最好根据需要进行重新设置。

甩掉控制终端

我们希望守护进程在后台默默运行不受控制终端的控制。这里是通过setsid() 函数来实现。调用这个函数的效果是:

1)创建一个新会话(session)
2)创建一个新进程组。
3)调用进程成为 新会话 的首进程
4)调用进程成为 新进程组 的组长进程
5)调用进程失去控制终端

最后一条正是我们需要的效果,但这个函数也有前提条件。那就是调用函数不能是进程组的组长进程,为了达到这个条件,我们通常的做法是,首先调用fork() 然后父进程退出,由子进程来setsid()。因为,子进程获得的进程组ID和自己的PID必然不同,也就是子进程必然不是进程组的组长进程,可以顺利调用setsid()

潜在的BUG

在基于System V的系统如Linux,存在以下的实现

当会话首进程打开第一个尚未与一个会话相关联的终端设备时,只要在调用open() 时没有指定O_NOCTTY标志,那么System V派生的系统将此作为控制终端分配给此会话。 —《APUE》

为了消除这个BUG,我们在通常的做法(先调用fork() 然后父进程退出,由子进程来setsid())之后,再调用一次fork(),然后再次让父进程退出,使用子进程,这样子进程不是会话(组)首进程,就消除了这个BUG。
当然也可以在之后每次open终端设备时加上O_NOCTTY标志。。。。

同时,在glibc中的daemon() 就因为其实现只是fork() 一次,存在这个BUG(来自man)

确定工作目录

这里主要是因为守护进程其长期工作的特性,如果当前目录为挂载的文件系统,会导致其文件系统不能被卸载。所以我们用chdir()显式地设置工作目录。

关闭不再需要的文件描述符

还是由于fork() 继承的原因可能具有不需要一些文件描述符,所以我们要显式的关闭。

告别标准输入输出

。。。其实前面都关了,不过考虑到某些和标准输出输入错误扯上关系的库函数,我们就把0,1,2设置为/dev/null


Demo:后台监控程序—Python实现

#!/usr/bin/env python
# coding=utf-8
# Jack Kang
import os
import time
import sys

# 检测port对应节点是否存活
def check(port):
    isAlive = "ps -ef | grep \"" + port + " \[cluster\]\"" 
    recovery = "redis-server ./" + port + "/redis.conf"  
    if os.system(isAlive):  #判断
        os.system(recovery) #进程不存在,重启节点



#设置为守护进程 

stdin = '/dev/null'
stdout = '/dev/null'
stderr = '/dev/null'

try:
    pid = os.fork()
    if pid > 0 :
        sys.exit(0)
except OSError, e:
    print "error #1"
    sys.exit(1)

os.chdir("./redis_cluster") # 切换工作目录
os.umask(0)                 # 设置文件模式创建屏蔽字
os.setsid()                 # 甩掉控制终端

# 第二次fork 保证子进程不是会话首进程
try:
    pid = os.fork()
    if pid > 0:
        sys.exit(0)        #父进程退出
except OSError:
    print "error #2"
    sys.exit(1)

for f in sys.stdout, sys.stderr: 
    f.flush()              # 刷新缓冲区

#将标准输出输入错误改为/dev/null   
si = open(stdin, 'r')
so = open(stdout, 'a+')
se = open(stderr, 'a+', 0)
os.dup2(si.fileno(), sys.stdin.fileno())
os.dup2(so.fileno(), sys.stdout.fileno())
os.dup2(se.fileno(), sys.stderr.fileno())

#主循环 每5s检测port进程是否存活
port = sys.argv[1]  
while True:
    check(port)
    time.sleep(5)

其实C实现和Python很像啦。这里就偷懒不写出C实现了。。。有空补上。

两次fork的结果截图

【浅谈守护进程】Demo:后台监控程序-- Python实现

可以看到pid 不等于sid 所以不是会话首进程

引用及参考

APUE第十三章(守护进程)第九章(进程关系)
Demo 中守护进程部分的实现 主要参考了Python实例浅谈之五Python守护进程和脚本单例运行

才疏学浅,不足之处,欢迎指正。

相关标签: python 守护进程