Java工作队列代码详解
我们写了通过一个命名的队列发送和接收消息,如果你还不了解请点击:rabbitmqjava入门。这篇中我们将会创建一个工作队列用来在工作者(consumer)间分发耗时任务。
工作队列的主要任务是:避免立刻执行资源密集型任务,然后必须等待其完成。相反地,我们进行任务调度:我们把任务封装为消息发送给队列。工作进行在后台运行并不断的从队列中取出任务然后执行。当你运行了多个工作进程时,任务队列中的任务将会被工作进程共享执行。
这样的概念在web应用中极其有用,当在很短的http请求间需要执行复杂的任务。
1、准备
我们使用thread.sleep来模拟耗时的任务。我们在发送到队列的消息的末尾添加一定数量的点,每个点代表在工作线程中需要耗时1秒,例如hello…将会需要等待3秒。
发送端:
newtask.java
import java.io.ioexception; import com.rabbitmq.client.channel; import com.rabbitmq.client.connection; import com.rabbitmq.client.connectionfactory; public class newtask { //队列名称 private final static string queue_name = "workqueue"; public static void main(string[] args) throws ioexception { //创建连接和频道 connectionfactory factory = new connectionfactory(); factory.sethost("localhost"); connection connection = factory.newconnection(); channel channel = connection.createchannel(); //声明队列 channel.queuedeclare(queue_name, false, false, false, null); //发送10条消息,依次在消息后面附加1-10个点 for (int i = 0; i < 10; i++) { string dots = ""; for (int j = 0; j <= i; j++) { dots += "."; } string message = "helloworld" + dots+dots.length(); channel.basicpublish("", queue_name, null, message.getbytes()); system.out.println(" [x] sent '" + message + "'"); } //关闭频道和资源 channel.close(); connection.close(); } }
接收端:
work.java
import com.rabbitmq.client.channel; import com.rabbitmq.client.connection; import com.rabbitmq.client.connectionfactory; import com.rabbitmq.client.queueingconsumer; public class work { //队列名称 private final static string queue_name = "workqueue"; public static void main(string[] argv) throws java.io.ioexception, java.lang.interruptedexception { //区分不同工作进程的输出 int hashcode = work.class.hashcode(); //创建连接和频道 connectionfactory factory = new connectionfactory(); factory.sethost("localhost"); connection connection = factory.newconnection(); channel channel = connection.createchannel(); //声明队列 channel.queuedeclare(queue_name, false, false, false, null); system.out.println(hashcode + " [*] waiting for messages. to exit press ctrl+c"); queueingconsumer consumer = new queueingconsumer(channel); // 指定消费队列 channel.basicconsume(queue_name, true, consumer); while (true) { queueingconsumer.delivery delivery = consumer.nextdelivery(); string message = new string(delivery.getbody()); system.out.println(hashcode + " [x] received '" + message + "'"); dowork(message); system.out.println(hashcode + " [x] done"); } } /** * 每个点耗时1s * @param task * @throws interruptedexception */ private static void dowork(string task) throws interruptedexception { for (char ch : task.tochararray()) { if (ch == '.') thread.sleep(1000); } } }
round-robin 转发
使用任务队列的好处是能够很容易的并行工作。如果我们积压了很多工作,我们仅仅通过增加更多的工作者就可以解决问题,使系统的伸缩性更加容易。
下面我们先运行3个工作者(work.java)实例,然后运行newtask.java,3个工作者实例都会得到信息。但是如何分配呢?让我们来看输出结果:
[x] sent 'helloworld.1' [x] sent 'helloworld..2' [x] sent 'helloworld...3' [x] sent 'helloworld....4' [x] sent 'helloworld.....5' [x] sent 'helloworld......6' [x] sent 'helloworld.......7' [x] sent 'helloworld........8' [x] sent 'helloworld.........9' [x] sent 'helloworld..........10' 工作者1: 605645 [*] waiting for messages. to exit press ctrl+c 605645 [x] received 'helloworld.1' 605645 [x] done 605645 [x] received 'helloworld....4' 605645 [x] done 605645 [x] received 'helloworld.......7' 605645 [x] done 605645 [x] received 'helloworld..........10' 605645 [x] done 工作者2: 18019860 [*] waiting for messages. to exit press ctrl+c 18019860 [x] received 'helloworld..2' 18019860 [x] done 18019860 [x] received 'helloworld.....5' 18019860 [x] done 18019860 [x] received 'helloworld........8' 18019860 [x] done 工作者3: 18019860 [*] waiting for messages. to exit press ctrl+c 18019860 [x] received 'helloworld...3' 18019860 [x] done 18019860 [x] received 'helloworld......6' 18019860 [x] done 18019860 [x] received 'helloworld.........9' 18019860 [x] done
可以看到,默认的,rabbitmq会一个一个的发送信息给下一个消费者(consumer),而不考虑每个任务的时长等等,且是一次性分配,并非一个一个分配。平均的每个消费者将会获得相等数量的消息。这样分发消息的方式叫做round-robin。
2、消息应答(messageacknowledgments)
执行一个任务需要花费几秒钟。你可能会担心当一个工作者在执行任务时发生中断。我们上面的代码,一旦rabbitmq交付了一个信息给消费者,会马上从内存中移除这个信息。在这种情况下,如果杀死正在执行任务的某个工作者,我们会丢失它正在处理的信息。我们也会丢失已经转发给这个工作者且它还未执行的消息。
上面的例子,我们首先开启两个任务,然后执行发送任务的代码(newtask.java),然后立即关闭第二个任务,结果为:
工作者2: 31054905[*]waitingformessages.toexitpressctrl+c 31054905[x]received'helloworld..2' 31054905[x]done 31054905[x]received'helloworld....4' 工作者1: 18019860[*]waitingformessages.toexitpressctrl+c 18019860[x]received'helloworld.1' 18019860[x]done 18019860[x]received'helloworld...3' 18019860[x]done 18019860[x]received'helloworld.....5' 18019860[x]done 18019860[x]received'helloworld.......7' 18019860[x]done 18019860[x]received'helloworld.........9' 18019860[x]done
可以看到,第二个工作者至少丢失了6,8,10号任务,且4号任务未完成。
但是,我们不希望丢失任何任务(信息)。当某个工作者(接收者)被杀死时,我们希望将任务传递给另一个工作者。
为了保证消息永远不会丢失,rabbitmq支持消息应答(messageacknowledgments)。消费者发送应答给rabbitmq,告诉它信息已经被接收和处理,然后rabbitmq可以*的进行信息删除。
如果消费者被杀死而没有发送应答,rabbitmq会认为该信息没有被完全的处理,然后将会重新转发给别的消费者。通过这种方式,你可以确认信息不会被丢失,即使消者偶尔被杀死。
这种机制并没有超时时间这么一说,rabbitmq只有在消费者连接断开是重新转发此信息。如果消费者处理一个信息需要耗费特别特别长的时间是允许的。
消息应答默认是打开的。上面的代码中我们通过显示的设置autoask=true关闭了这种机制。下面我们修改代码(work.java):
boolean ack = false ; //打开应答机制 channel.basicconsume(queue_name, ack, consumer); //另外需要在每次处理完成一个消息后,手动发送一次应答。 channel.basicack(delivery.getenvelope().getdeliverytag(), false);
完整修改后的work.java
import com.rabbitmq.client.channel; import com.rabbitmq.client.connection; import com.rabbitmq.client.connectionfactory; import com.rabbitmq.client.queueingconsumer; public class work { //队列名称 private final static string queue_name = "workqueue"; public static void main(string[] argv) throws java.io.ioexception, java.lang.interruptedexception { //区分不同工作进程的输出 int hashcode = work.class.hashcode(); //创建连接和频道 connectionfactory factory = new connectionfactory(); factory.sethost("localhost"); connection connection = factory.newconnection(); channel channel = connection.createchannel(); //声明队列 channel.queuedeclare(queue_name, false, false, false, null); system.out.println(hashcode + " [*] waiting for messages. to exit press ctrl+c"); queueingconsumer consumer = new queueingconsumer(channel); // 指定消费队列 boolean ack = false ; //打开应答机制 channel.basicconsume(queue_name, ack, consumer); while (true) { queueingconsumer.delivery delivery = consumer.nextdelivery(); string message = new string(delivery.getbody()); system.out.println(hashcode + " [x] received '" + message + "'"); dowork(message); system.out.println(hashcode + " [x] done"); //发送应答 channel.basicack(delivery.getenvelope().getdeliverytag(), false); } } }
测试:
我们把消息数量改为5,然后先打开两个消费者(work.java),然后发送任务(newtask.java),立即关闭一个消费者,观察输出:
[x]sent'helloworld.1' [x]sent'helloworld..2' [x]sent'helloworld...3' [x]sent'helloworld....4' [x]sent'helloworld.....5' 工作者2 18019860[*]waitingformessages.toexitpressctrl+c 18019860[x]received'helloworld..2' 18019860[x]done 18019860[x]received'helloworld....4' 工作者1 31054905[*]waitingformessages.toexitpressctrl+c 31054905[x]received'helloworld.1' 31054905[x]done 31054905[x]received'helloworld...3' 31054905[x]done 31054905[x]received'helloworld.....5' 31054905[x]done 31054905[x]received'helloworld....4' 31054905[x]done
可以看到工作者2没有完成的任务4,重新转发给工作者1进行完成了。
3、消息持久化(messagedurability)
我们已经学习了即使消费者被杀死,消息也不会被丢失。但是如果此时rabbitmq服务被停止,我们的消息仍然会丢失。
当rabbitmq退出或者异常退出,将会丢失所有的队列和信息,除非你告诉它不要丢失。我们需要做两件事来确保信息不会被丢失:我们需要给所有的队列和消息设置持久化的标志。
第一,我们需要确认rabbitmq永远不会丢失我们的队列。为了这样,我们需要声明它为持久化的。
booleandurable=true;
channel.queuedeclare("task_queue",durable,false,false,null);
注:rabbitmq不允许使用不同的参数重新定义一个队列,所以已经存在的队列,我们无法修改其属性。
第二,我们需要标识我们的信息为持久化的。通过设置messageproperties(implementsbasicproperties)值为persistent_text_plain。
channel.basicpublish("","task_queue",messageproperties.persistent_text_plain,message.getbytes());
现在你可以执行一个发送消息的程序,然后关闭服务,再重新启动服务,运行消费者程序做下实验。
4、公平转发(fairdispatch)
或许会发现,目前的消息转发机制(round-robin)并非是我们想要的。例如,这样一种情况,对于两个消费者,有一系列的任务,奇数任务特别耗时,而偶数任务却很轻松,这样造成一个消费者一直繁忙,另一个消费者却很快执行完任务后等待。
造成这样的原因是因为rabbitmq仅仅是当消息到达队列进行转发消息。并不在乎有多少任务消费者并未传递一个应答给rabbitmq。仅仅盲目转发所有的奇数给一个消费者,偶数给另一个消费者。
为了解决这样的问题,我们可以使用basicqos方法,传递参数为prefetchcount=1。这样告诉rabbitmq不要在同一时间给一个消费者超过一条消息。换句话说,只有在消费者空闲的时候会发送下一条信息。
int prefetchcount = 1; channel.basicqos(prefetchcount);
注:如果所有的工作者都处于繁忙状态,你的队列有可能被填充满。你可能会观察队列的使用情况,然后增加工作者,或者使用别的什么策略。
测试:改变发送消息的代码,将消息末尾点数改为6-2个,然后首先开启两个工作者,接着发送消息:
[x] sent 'helloworld......6' [x] sent 'helloworld.....5' [x] sent 'helloworld....4' [x] sent 'helloworld...3' [x] sent 'helloworld..2' 工作者1: 18019860 [*] waiting for messages. to exit press ctrl+c 18019860 [x] received 'helloworld......6' 18019860 [x] done 18019860 [x] received 'helloworld...3' 18019860 [x] done 工作者2: 31054905 [*] waiting for messages. to exit press ctrl+c 31054905 [x] received 'helloworld.....5' 31054905 [x] done 31054905 [x] received 'helloworld....4' 31054905 [x] done 31054905 [x] received 'helloworld..2' 31054905 [x] done
可以看出此时并没有按照之前的round-robin机制进行转发消息,而是当消费者不忙时进行转发。且这种模式下支持动态增加消费者,因为消息并没有发送出去,动态增加了消费者马上投入工作。而默认的转发机制会造成,即使动态增加了消费者,此时的消息已经分配完毕,无法立即加入工作,即使有很多未完成的任务。
5、完整的代码
newtask.java
import java.io.ioexception; import com.rabbitmq.client.channel; import com.rabbitmq.client.connection; import com.rabbitmq.client.connectionfactory; import com.rabbitmq.client.messageproperties; public class newtask { // 队列名称 private final static string queue_name = "workqueue_persistence"; public static void main(string[] args) throws ioexception { // 创建连接和频道 connectionfactory factory = new connectionfactory(); factory.sethost("localhost"); connection connection = factory.newconnection(); channel channel = connection.createchannel(); // 声明队列 boolean durable = true; // 1、设置队列持久化 channel.queuedeclare(queue_name, durable, false, false, null); // 发送10条消息,依次在消息后面附加1-10个点 for (int i = 5; i > 0; i--) { string dots = ""; for (int j = 0; j <= i; j++) { dots += "."; } string message = "helloworld" + dots + dots.length(); // messageproperties 2、设置消息持久化 channel.basicpublish("", queue_name, messageproperties.persistent_text_plain, message.getbytes()); system.out.println(" [x] sent '" + message + "'"); } // 关闭频道和资源 channel.close(); connection.close(); } }
work.java
import com.rabbitmq.client.channel; import com.rabbitmq.client.connection; import com.rabbitmq.client.connectionfactory; import com.rabbitmq.client.queueingconsumer; public class work { // 队列名称 private final static string queue_name = "workqueue_persistence"; public static void main(string[] argv) throws java.io.ioexception, java.lang.interruptedexception { // 区分不同工作进程的输出 int hashcode = work.class.hashcode(); // 创建连接和频道 connectionfactory factory = new connectionfactory(); factory.sethost("localhost"); connection connection = factory.newconnection(); channel channel = connection.createchannel(); // 声明队列 boolean durable = true; channel.queuedeclare(queue_name, durable, false, false, null); system.out.println(hashcode + " [*] waiting for messages. to exit press ctrl+c"); //设置最大服务转发消息数量 int prefetchcount = 1; channel.basicqos(prefetchcount); queueingconsumer consumer = new queueingconsumer(channel); // 指定消费队列 boolean ack = false; // 打开应答机制 channel.basicconsume(queue_name, ack, consumer); while (true) { queueingconsumer.delivery delivery = consumer.nextdelivery(); string message = new string(delivery.getbody()); system.out.println(hashcode + " [x] received '" + message + "'"); dowork(message); system.out.println(hashcode + " [x] done"); //channel.basicack(delivery.getenvelope().getdeliverytag(), false); channel.basicack(delivery.getenvelope().getdeliverytag(), false); } } /** * 每个点耗时1s * * @param task * @throws interruptedexception */ private static void dowork(string task) throws interruptedexception { for (char ch : task.tochararray()) { if (ch == '.') thread.sleep(1000); } } }
总结
以上就是本文关于java工作队列代码详解的全部内容,希望对大家有所帮助。如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!