RabbitMQ之工作队列

jopen 10年前

上一篇博客中我们写了通过一个命名的队列发送和接收消息的Hello World示例。这篇中我们将会创建一个工作队列用来在consumer间分发耗时任务。

工作队列的主要任务是:避免立刻执行资源消耗密集型任务并且必须要等待其完成。相反地,我们进行任务调度:我们把任务封装为消息发送给队列。consumer运行在后台并不断的从队列中取出任务执行。当你运行了多个consumer进程时,任务队列中的任务将会被consumer进程共享执行。

1. 准备

我们使用Thread.sleep来模拟耗时的任务。我们在发送到队列的消息的末尾添加一定数量的点,每个点代表在工作线程(consumer)中需要耗时1秒,例如hello...将会需要等待3秒。

发送端:NewTask.java

package cc.openscanner;    import java.io.IOException;    import com.rabbitmq.client.Channel;  import com.rabbitmq.client.Connection;  import com.rabbitmq.client.ConnectionFactory;    public class NewTask {      //队列名称      private final static String QUEUE_NAME = "workqueue";      public static void main(String[] args) throws IOException {          //创建连接和通道          ConnectionFactory factory = new ConnectionFactory();          factory.setHost("localhost");          Connection connection = factory.newConnection();          Channel channel = connection.createChannel();          //声明队列          channel.queueDeclare(QUEUE_NAME, false, false, false, null);          //发送10条消息,依次在消息后面附加1~10个点          for (int i=0; i<10;i++) {              StringBuilder dots = new StringBuilder();              for(int j=0;j<=i;j++){                  dots.append(".");              }              String message = "helloworld" + dots.toString();              channel.basicPublish("", QUEUE_NAME, null, message.getBytes());              System.out.println(" [x] Sent '" + message + "'");          }          //关闭通道和资源          channel.close();          connection.close();      }  }

接收端:Work.java

package cc.openscanner;    import com.rabbitmq.client.Channel;  import com.rabbitmq.client.Connection;  import com.rabbitmq.client.ConnectionFactory;  import com.rabbitmq.client.QueueingConsumer;    public class Work {      //队列名称      private final static String QUEUE_NAME = "workqueue";      public static void main(String[] args)                throws java.io.IOException,java.lang.InterruptedException{          //区分不同工作进程的输出          int hashCode = Work.class.hashCode();          //创建连接和通道          ConnectionFactory factory = new ConnectionFactory();          factory.setHost("localhost");          Connection connection = factory.newConnection();          Channel channel = connection.createChannel();          //声明队列          channel.queueDeclare(QUEUE_NAME, false, false, false, null);          System.out.println(hashCode + " [*] Waiting for messages. To exit press CTRL+C");          QueueingConsumer consumer = new QueueingConsumer(channel);          //指定消费队列          channel.basicConsume(QUEUE_NAME, true, consumer);          while(true){              QueueingConsumer.Delivery delivery = consumer.nextDelivery();              String message = new String(delivery.getBody());              System.out.println(hashCode + " [x] Received '" + message + "'");              doWork(message);              System.out.println(hashCode + " [x] done");          }      }      private static void doWork(String task) throws InterruptedException {          int n = 0;          for(char ch :task.toCharArray()){              if(ch == '.') n++;          }          if(n > 0) Thread.sleep(n*1000);      }  }

Round-robin转发

使用任务队列的好处是能够很容易的并行工作。如果我们积压了很多工作,我们仅仅通过增加更多的工作者(consumer)就可以解决问题,使系统的伸缩性更加容易。 下面我们先运行3个工作者(Work.java)实例,然后运行NewTask.java,3个工作者实例都会得到信息。但是如何分配呢?让我们来看看输出结果:

 [x] Sent 'helloworld.'
 [x] Sent 'helloworld..'
 [x] Sent 'helloworld...'
 [x] Sent 'helloworld....'
 [x] Sent 'helloworld.....'
 [x] Sent 'helloworld......'
 [x] Sent 'helloworld.......'
 [x] Sent 'helloworld........'
 [x] Sent 'helloworld.........'
 [x] Sent 'helloworld..........'

工作者1:

1028566121 [x] Waiting for messages. To exit press CTRL+C
1028566121 [x] Received 'helloworld.'
1028566121 [x] done
1028566121 [x] Received 'helloworld....'
1028566121 [x] done
1028566121 [x] Received 'helloworld.......'
1028566121 [x] done
1028566121 [x] Received 'helloworld..........'
1028566121 [x] done
工作者2:

1028566121 [x] Waiting for messages. To exit press CTRL+C
1028566121 [x] Received 'helloworld..'
1028566121 [x] done
1028566121 [x] Received 'helloworld.....'
1028566121 [x] done
1028566121 [x] Received 'helloworld........'
1028566121 [x] done

工作者3:

1028566121 [x] Waiting for messages. To exit press CTRL+C
1028566121 [x] Received 'helloworld...'
1028566121 [x] done
1028566121 [x] Received 'helloworld......'
1028566121 [x] done
1028566121 [x] Received 'helloworld.........'
1028566121 [x] done
可以看到,默认的,RabbitMQ会一个一个的发送信息给下一个消费者(consumer),而不考虑每个任务的时长等等,且是一次性分配,并非一个一个分配。平均的每个消费者将会获得相等数量的消息。这样分发消息的方式叫做round-robin。

2. 消息应答(message acknowledgments)
执行一个任务需要花费几秒钟。你可能会担心当一个工作者在执行任务时发生中断。我们上面的代码,一旦RabbitMQ交付了一个信息给消费者,会马上从内存中移除这个信息。在这种情况下,如果杀死正在执行任务的某个工作者,我们会丢失它正处理的信息。我们也会丢失已经转发给这个工作者且它还未执行的消息。上面的例子,我们首先开启两个任务,然后执行发送任务的代码(NewTask.java),然后立即关闭第二个任务,结果为:

1028566121 [x] Waiting for messages. To exit press CTRL+C
1028566121 [x] Received 'helloworld..'
1028566121 [x] done
1028566121 [x] Received 'helloworld....'
1028566121 [x] done
1028566121 [x] Received 'helloworld......'
1028566121 [x] done
1028566121 [x] Received 'helloworld........'
1028566121 [x] done
1028566121 [x] Received 'helloworld..........'
1028566121 [x] done
与:

1028566121 [x] Waiting for messages. To exit press CTRL+C
1028566121 [x] Received 'helloworld.'
1028566121 [x] done
1028566121 [x] Received 'helloworld...'
1028566121 [x] done
1028566121 [x] Received 'helloworld.....'
可以看到,丢失了一些任务。但是,我们不希望丢失任何任务(信息)。当某个工作者(接收者)被杀死,我们希望将任务传递给另一个工作者(consumer)。为了保证消息永远不会丢失,RabbitMQ支持消息应答(message acknowledgments)。消费者发送应答给RabbitMQ,告诉它信息已经被接收和处理,然后RabbitMQ可以自由的进行信息删除。如果消费者被杀死而没有发送应答,RabbitMQ会认为该信息没有被完全的处理,然后将会重新转发给别的消费者。通过这种方式,你可以确认信息不会被丢失,即使消费者偶尔被杀死。
这种机制并没有超时时间这么一说,RabbitMQ只有在消费者连接断开时重新转发此信息。如果消费者处理一个信息需要耗费特别长的时间是允许的。

消息应答默认是打开的。上面的代码中我们通过显示的设置autoAsk=true关闭了这种机制。下面我们修改代码(Work.java):

boolean ack = false;    //打开应答机制  Channel.basicConsume(QUEUE_NAME,ack,consumer);          //另外需要在每次处理完成一个消息后,手动发送一次应答。  channel.basicAck(delivery.getEnvelope().getDeliveryTag(),false);

完整修改后的Work.java:

package cc.openscanner;    import java.io.IOException;  import com.rabbitmq.client.Channel;  import com.rabbitmq.client.Connection;  import com.rabbitmq.client.ConnectionFactory;    public class NewTask {      //队列名称      private final static String QUEUE_NAME = "workqueue";      public static void main(String[] args) throws IOException {          //创建连接和通道          ConnectionFactory factory = new ConnectionFactory();          factory.setHost("localhost");          Connection connection = factory.newConnection();          Channel channel = connection.createChannel();          //声明队列          channel.queueDeclare(QUEUE_NAME, false, false, false, null);          //发送10条消息,依次在消息后面附加1~10个点          for (int i=0; i<10;i++) {              StringBuilder dots = new StringBuilder();              for(int j=0;j<=i;j++){                  dots.append(".");              }              String message = "helloworld" + dots.toString();              channel.basicPublish("", QUEUE_NAME, null, message.getBytes());              System.out.println(" [x] Sent '" + message + "'");          }          //关闭通道和资源          channel.close();          connection.close();      }  }

这个就不测试了,大家自己去尝试下。

3. 消息持久化(Message durability)

我们已经学习了即使消费者被杀死,消息也不会被丢失。但是如果此时RabbitMQ服务被停止,我们的消息仍然会丢失。当RabbitMQ退出或者异常退出,将会丢失所有的队列和信息,除非你告诉它不要丢失。我们需要做两件事来确保信息不会被丢:我们需要给所有的队列和消息设置持久化标志。

第一,我们需要确认RabbitMQ永远不会丢失我们的队列。为了这样,我们需要声明它为持久化的:

boolean durable = true;  channel.queueDeclare("task_queue",durable,false,false,null);

注:RabbitMQ不允许使用不同的参数重新定义一个队列,所以已经存在的队列,我们无法修改其属性。

第二,我们需要标识我们的信息为持久化的。通过设置MessageProperties(implements BasicProperties)值为PERSISTENT_TEXT_PLAIN:

channel.basicPublish("","task_queue",          MessageProperties.PERSISTENT_TEXT_PLAIN,message.getBytes());

现在你可以执行一个发送消息的程序,然后关闭服务,再重新启动服务,运行消费者程序做下实验。

4. 公平转发(Fair dispatch)