某业务付费统计脚本问题排查
现象:产品反馈未收到每周五的vip邮箱付费统计邮件
1. 这个统计脚本我从未经手过,因此不知道逻辑是什么,也不知道代码在哪里.通过查看邮件源文件中的来源ip,找到了发出邮件所在的服务器,信头中有类似这样的来源ip
x-originating-ip: [xx.xx.xx.86]
2.登陆服务器后,查看crontab的定时规则,找到定时规则是0 0 * * * /bin/sh /xxx/feeuser.sh.每天都会执行一次feeuser.sh的脚本.通过cron.log可以看到该脚本已经执行过了
3.脚本中的逻辑是,每天判断今天的日志文件是否存在,如果不存在就执行一个php脚本,把该脚本的输出重定向到这个日志文件中.
判断如果是周五,就调用php脚本发送一封通知邮件,邮件的内容是对每天日志文件的wc -l行数统计.
4.今天是周五但是邮件没有发出,说明根本就没有执行到发送邮件的逻辑.在前面的统计今天用户付费情况时就已经断掉了.
5.查看php.ini的配置文件,看到没有开启log_errors,也没有指定error_log的位置,所以没法通过php的日志看到发生了什么错误
6.此脚本是14年左右开始运行的,时间也比较久了.在研究php代码的逻辑后发现,在查询数据库的时候,先查出第一个数据库的某表信息后,循环查询另一个数据库的另一张表,在这个循环的过程中,连接数据库的逻辑放在了循环块里面,猜测可能因为连接过多,被数据库拒绝后读取失败吧.
7.里面还有处逻辑挺有想法,读取第一张表的时候,每次只查询10000条,然后再从新连接数据库new pdo对象,估计也是为了防止执行时间太长连接断掉.
每天php脚本把用户查询出来后,重定向到比如2019-9-20-user.log,周五在统计每天的日志行数发送给产品,这样就可以如果产品需要具体用户时也可以留着这个结果
8.先把连接数据库逻辑挪出来,补齐了强两天断掉的数据,把错误日志打开暂时先观察观察