RabbitMQ之工作队列
上一篇博客中我们写了通过一个命名的队列发送和接收消息的Hello World示例。这篇中我们将会创建一个工作队列用来在consumer间分发耗时任务。
工作队列的主要任务是:避免立刻执行资源消耗密集型任务并且必须要等待其完成。相反地,我们进行任务调度:我们把任务封装为消息发送给队列。consumer运行在后台并不断的从队列中取出任务执行。当你运行了多个consumer进程时,任务队列中的任务将会被consumer进程共享执行。
1. 准备
我们使用Thread.sleep来模拟耗时的任务。我们在发送到队列的消息的末尾添加一定数量的点,每个点代表在工作线程(consumer)中需要耗时1秒,例如hello...将会需要等待3秒。
发送端:NewTask.java
package cc.openscanner; import java.io.IOException; import com.rabbitmq.client.Channel; import com.rabbitmq.client.Connection; import com.rabbitmq.client.ConnectionFactory; public class NewTask { //队列名称 private final static String QUEUE_NAME = "workqueue"; public static void main(String[] args) throws IOException { //创建连接和通道 ConnectionFactory factory = new ConnectionFactory(); factory.setHost("localhost"); Connection connection = factory.newConnection(); Channel channel = connection.createChannel(); //声明队列 channel.queueDeclare(QUEUE_NAME, false, false, false, null); //发送10条消息,依次在消息后面附加1~10个点 for (int i=0; i<10;i++) { StringBuilder dots = new StringBuilder(); for(int j=0;j<=i;j++){ dots.append("."); } String message = "helloworld" + dots.toString(); channel.basicPublish("", QUEUE_NAME, null, message.getBytes()); System.out.println(" [x] Sent '" + message + "'"); } //关闭通道和资源 channel.close(); connection.close(); } }
接收端:Work.java
package cc.openscanner; import com.rabbitmq.client.Channel; import com.rabbitmq.client.Connection; import com.rabbitmq.client.ConnectionFactory; import com.rabbitmq.client.QueueingConsumer; public class Work { //队列名称 private final static String QUEUE_NAME = "workqueue"; public static void main(String[] args) throws java.io.IOException,java.lang.InterruptedException{ //区分不同工作进程的输出 int hashCode = Work.class.hashCode(); //创建连接和通道 ConnectionFactory factory = new ConnectionFactory(); factory.setHost("localhost"); Connection connection = factory.newConnection(); Channel channel = connection.createChannel(); //声明队列 channel.queueDeclare(QUEUE_NAME, false, false, false, null); System.out.println(hashCode + " [*] Waiting for messages. To exit press CTRL+C"); QueueingConsumer consumer = new QueueingConsumer(channel); //指定消费队列 channel.basicConsume(QUEUE_NAME, true, consumer); while(true){ QueueingConsumer.Delivery delivery = consumer.nextDelivery(); String message = new String(delivery.getBody()); System.out.println(hashCode + " [x] Received '" + message + "'"); doWork(message); System.out.println(hashCode + " [x] done"); } } private static void doWork(String task) throws InterruptedException { int n = 0; for(char ch :task.toCharArray()){ if(ch == '.') n++; } if(n > 0) Thread.sleep(n*1000); } }
Round-robin转发
使用任务队列的好处是能够很容易的并行工作。如果我们积压了很多工作,我们仅仅通过增加更多的工作者(consumer)就可以解决问题,使系统的伸缩性更加容易。 下面我们先运行3个工作者(Work.java)实例,然后运行NewTask.java,3个工作者实例都会得到信息。但是如何分配呢?让我们来看看输出结果:
[x] Sent 'helloworld.'
[x] Sent 'helloworld..'
[x] Sent 'helloworld...'
[x] Sent 'helloworld....'
[x] Sent 'helloworld.....'
[x] Sent 'helloworld......'
[x] Sent 'helloworld.......'
[x] Sent 'helloworld........'
[x] Sent 'helloworld.........'
[x] Sent 'helloworld..........'
工作者1:
1028566121 [x] Waiting for messages. To exit press CTRL+C
1028566121 [x] Received 'helloworld.'
1028566121 [x] done
1028566121 [x] Received 'helloworld....'
1028566121 [x] done
1028566121 [x] Received 'helloworld.......'
1028566121 [x] done
1028566121 [x] Received 'helloworld..........'
1028566121 [x] done
工作者2:
1028566121 [x] Waiting for messages. To exit press CTRL+C
1028566121 [x] Received 'helloworld..'
1028566121 [x] done
1028566121 [x] Received 'helloworld.....'
1028566121 [x] done
1028566121 [x] Received 'helloworld........'
1028566121 [x] done
工作者3:
1028566121 [x] Waiting for messages. To exit press CTRL+C
1028566121 [x] Received 'helloworld...'
1028566121 [x] done
1028566121 [x] Received 'helloworld......'
1028566121 [x] done
1028566121 [x] Received 'helloworld.........'
1028566121 [x] done
可以看到,默认的,RabbitMQ会一个一个的发送信息给下一个消费者(consumer),而不考虑每个任务的时长等等,且是一次性分配,并非一个一个分配。平均的每个消费者将会获得相等数量的消息。这样分发消息的方式叫做round-robin。
2. 消息应答(message acknowledgments)
执行一个任务需要花费几秒钟。你可能会担心当一个工作者在执行任务时发生中断。我们上面的代码,一旦RabbitMQ交付了一个信息给消费者,会马上从内存中移除这个信息。在这种情况下,如果杀死正在执行任务的某个工作者,我们会丢失它正处理的信息。我们也会丢失已经转发给这个工作者且它还未执行的消息。上面的例子,我们首先开启两个任务,然后执行发送任务的代码(NewTask.java),然后立即关闭第二个任务,结果为:
1028566121 [x] Waiting for messages. To exit press CTRL+C
1028566121 [x] Received 'helloworld..'
1028566121 [x] done
1028566121 [x] Received 'helloworld....'
1028566121 [x] done
1028566121 [x] Received 'helloworld......'
1028566121 [x] done
1028566121 [x] Received 'helloworld........'
1028566121 [x] done
1028566121 [x] Received 'helloworld..........'
1028566121 [x] done
与:
1028566121 [x] Waiting for messages. To exit press CTRL+C
1028566121 [x] Received 'helloworld.'
1028566121 [x] done
1028566121 [x] Received 'helloworld...'
1028566121 [x] done
1028566121 [x] Received 'helloworld.....'
可以看到,丢失了一些任务。但是,我们不希望丢失任何任务(信息)。当某个工作者(接收者)被杀死,我们希望将任务传递给另一个工作者(consumer)。为了保证消息永远不会丢失,RabbitMQ支持消息应答(message acknowledgments)。消费者发送应答给RabbitMQ,告诉它信息已经被接收和处理,然后RabbitMQ可以自由的进行信息删除。如果消费者被杀死而没有发送应答,RabbitMQ会认为该信息没有被完全的处理,然后将会重新转发给别的消费者。通过这种方式,你可以确认信息不会被丢失,即使消费者偶尔被杀死。
这种机制并没有超时时间这么一说,RabbitMQ只有在消费者连接断开时重新转发此信息。如果消费者处理一个信息需要耗费特别长的时间是允许的。
消息应答默认是打开的。上面的代码中我们通过显示的设置autoAsk=true关闭了这种机制。下面我们修改代码(Work.java):
boolean ack = false; //打开应答机制 Channel.basicConsume(QUEUE_NAME,ack,consumer); //另外需要在每次处理完成一个消息后,手动发送一次应答。 channel.basicAck(delivery.getEnvelope().getDeliveryTag(),false);
完整修改后的Work.java:
package cc.openscanner; import java.io.IOException; import com.rabbitmq.client.Channel; import com.rabbitmq.client.Connection; import com.rabbitmq.client.ConnectionFactory; public class NewTask { //队列名称 private final static String QUEUE_NAME = "workqueue"; public static void main(String[] args) throws IOException { //创建连接和通道 ConnectionFactory factory = new ConnectionFactory(); factory.setHost("localhost"); Connection connection = factory.newConnection(); Channel channel = connection.createChannel(); //声明队列 channel.queueDeclare(QUEUE_NAME, false, false, false, null); //发送10条消息,依次在消息后面附加1~10个点 for (int i=0; i<10;i++) { StringBuilder dots = new StringBuilder(); for(int j=0;j<=i;j++){ dots.append("."); } String message = "helloworld" + dots.toString(); channel.basicPublish("", QUEUE_NAME, null, message.getBytes()); System.out.println(" [x] Sent '" + message + "'"); } //关闭通道和资源 channel.close(); connection.close(); } }
这个就不测试了,大家自己去尝试下。
3. 消息持久化(Message durability)
我们已经学习了即使消费者被杀死,消息也不会被丢失。但是如果此时RabbitMQ服务被停止,我们的消息仍然会丢失。当RabbitMQ退出或者异常退出,将会丢失所有的队列和信息,除非你告诉它不要丢失。我们需要做两件事来确保信息不会被丢:我们需要给所有的队列和消息设置持久化标志。
第一,我们需要确认RabbitMQ永远不会丢失我们的队列。为了这样,我们需要声明它为持久化的:
boolean durable = true; channel.queueDeclare("task_queue",durable,false,false,null);
注:RabbitMQ不允许使用不同的参数重新定义一个队列,所以已经存在的队列,我们无法修改其属性。
第二,我们需要标识我们的信息为持久化的。通过设置MessageProperties(implements BasicProperties)值为PERSISTENT_TEXT_PLAIN:
channel.basicPublish("","task_queue", MessageProperties.PERSISTENT_TEXT_PLAIN,message.getBytes());
现在你可以执行一个发送消息的程序,然后关闭服务,再重新启动服务,运行消费者程序做下实验。
4. 公平转发(Fair dispatch)