PHP使用php-resque库配合Redis实现MQ消息队列的教程
消息队列处理后台任务带来的问题
项目中经常会有后台运行任务的需求,比如发送邮件时,因为要连接邮件服务器,往往需要5-10秒甚至更长时间,如果能先给用户一个成功的提示信息,然后在后台慢慢处理发送邮件的操作,显然会有更好的用户体验。
为了实现类似的需求,web项目中一般的实现方法是使用消息队列(message queue),比如memcacheq,rabbitmq等等,都是很著名的产品。
消息队列说白了就是一个最简单的先进先出队列,队列的一个成员就是一段文本。正是因为消息队列实在太简单了,当拿着消息队列时,反而有点无从下手的感觉,因为这仅仅一个发送邮件的任务,就会引申出很多问题:
- 消息队列只能存储字符串类型的数据,如何将一个发送邮件这样的“任务”,转换为消息队列中的一个“消息”?
- 消息队列只负责数据的存放与进出,本身不能执行任何程序,那么我们要如何从消息队列中一个一个取出数据,再将这些数据转化回任务并执行。
- 我们无法预知消息队列何时会有数据产生,所以我们的任务执行程序还需要具备监控消息队列的能力,也就是一个常驻后台的守护进程。
- 一般的web应用php都以cgi方式运行,无法常驻内存。我们知道php还有cli模式,那么守护进程是否能以php cli来实现,效率如何?
- 当守护进程运行时,web应用能否与后台守护进程交互,实现开启/杀死进程的功能以及获得进程的运行状态?
resque对后台任务的设计与角色划分
对以上这些问题,目前为止我能找到的最好答案,并不是来自php,而是来自ruby的项目resque,正是由于resque清晰简单的解决了后台任务带来的一系列问题,resque的设计也被clone到python、php、nodejs等语言:比如python下的pyres以及php下的php-resque等等,这里有各种语言版本的resque实现,而在本篇日志里,我们当然要以php版本为例来说明如何用php-resque运行一个后台任务,可能一些细节方面会与ruby版有出入,但是本文中以php版为准。
resque是这样解决这些问题的:
后台任务的角色划分
其实从上面的问题已经可以看出,只靠一个消息队列是无法解决所有问题的,需要新的角色介入。在resque中,一个后台任务被抽象为由三种角色共同完成:
- job | 任务 : 一个job就是一个需要在后台完成的任务,比如本文举例的发送邮件,就可以抽象为一个job。在resque中一个job就是一个class。
- queue | 队列 : 也就是上文的消息队列,在resque中,队列则是由redis实现的。resque还提供了一个简单的队列管理器,可以实现将job插入/取出队列等功能。
- worker | 执行者 : 负责从队列中取出job并执行,可以以守护进程的方式运行在后台。
那么基于这个划分,一个后台任务在resque下的基本流程是这样的:
- 将一个后台任务编写为一个独立的class,这个class就是一个job。
- 在需要使用后台程序的地方,系统将job class的名称以及所需参数放入队列。
- 以命令行方式开启一个worker,并通过参数指定worker所需要处理的队列。
- worker作为守护进程运行,并且定时检查队列。
- 当队列中有job时,worker取出job并运行,即实例化job class并执行class中的方法。
至此就可以完整的运行完一个后台任务。
在resque中,还有一个很重要的设计:一个worker,可以处理一个队列,也可以处理很多个队列,并且可以通过增加worker的进程/线程数来加快队列的执行速度。
php-resque的安装
需要提前说明的是,由于涉及到进程的开辟与管理,php-resque使用了php的pcntl函数,所以只能在linux下运行,并且需要php编译pcntl函数。如果希望用windows做同样的工作,那么可以去找找resque的其他语言版本,php在windows下非常不适合做后台任务。
以ubuntu12.04lts为例,ubuntu用apt安装的php已经默认编译了pcntl函数,无需任何配置,以下指令均为root帐号
安装redis
apt-get install redis-server
安装composer
apt-get install curl cd /usr/local/bin curl -s http://getcomposer.org/installer | php chmod a+x composer.phar alias composer='/usr/local/bin/composer.phar'
使用composer安装php-resque
假设web目录在/opt/htdocs
apt-get install git git-core cd /opt/htdocs git clone git://github.com/chrisboulton/php-resque.git cd php-resque composer install
php-resque的使用
1.编写一个worker
其实php-resque已经给出了简单的例子, demo/job.php文件就是一个最简单的job:
class php_job { public function perform() { sleep(120); fwrite(stdout, 'hello!'); } }
这个job就是在120秒后向stdout输出字符hello!
在resque的设计中,一个job必须存在一个perform方法,worker则会自动运行这个方法。
2.将job插入队列
php-resque也给出了最简单的插入队列实现 demo/queue.php:
if(empty($argv[1])) { die('specify the name of a job to add. e.g, php queue.php php_job'); } require __dir__ . '/init.php'; date_default_timezone_set('gmt'); resque::setbackend('127.0.0.1:6379'); $args = array( 'time' => time(), 'array' => array( 'test' => 'test', ), ); $jobid = resque::enqueue('default', $argv[1], $args, true); echo "queued job ".$jobid."\n\n";
在这个例子中,queue.php需要以cli方式运行,将cli接收到的第一个参数作为job名称,插入名为'default'的队列,同时向屏幕输出刚才插入队列的job id。在终端输入:
php demo/queue.php php_job
结果可以看到屏幕上输出:
queued job b1f01038e5e833d24b46271a0e31f6d6
即job已经添加成功。注意这里的job名称与我们编写的job class名称保持一致:php_job
3.查看job运行情况
php-resque同样提供了查看job运行状态的例子,直接运行:
php demo/check_status.php b1f01038e5e833d24b46271a0e31f6d6
可以看到输出为:
tracking status of b1f01038e5e833d24b46271a0e31f6d6. press [break] to stop. status of b1f01038e5e833d24b46271a0e31f6d6 is: 1
我们刚才创建的job状态为1。在resque中,一个job有以下4种状态:
- resque_job_status::status_waiting = 1; (等待)
- resque_job_status::status_running = 2; (正在执行)
- resque_job_status::status_failed = 3; (失败)
- resque_job_status::status_complete = 4; (结束)
因为没有worker运行,所以刚才创建的job还是等待状态。
4.运行worker
这次我们直接编写demo/resque.php:
<?php date_default_timezone_set('gmt'); require 'job.php'; require '../bin/resque';
可以看到一个worker至少需要两部分:
可以直接包含job类文件,也可以使用php的自动加载机制,指定好job class所在路径并能实现自动加载
包含resque的默认worker: bin/resque
在终端中运行:
queue=default php demo/resque.php
前面的queue部分是设置环境变量,我们指定当前的worker只负责处理default队列。也可以使用
queue=* php demo/resque.php
来处理所有队列。
运行后输出为
#!/usr/bin/env php *** starting worker
用ps指令检查一下:
ps aux | grep resque
可以看到有一个php的守护进程已经在运行了
1000 4607 0.0 0.1 74816 11612 pts/3 s+ 14:52 0:00 php demo/resque.php
再使用之前的检查job指令
php demo/check_status.php b1f01038e5e833d24b46271a0e31f6d6
2分钟后可以看到
status of b1f01038e5e833d24b46271a0e31f6d6 is: 4
任务已经运行完毕,同时屏幕上应该可以看到输出的hello!