Java并发专题 带返回结果的批量任务执行 CompletionService ExecutorService.invokeAll
转载请标明出处:http://blog.csdn.net/lmj623565791/article/details/27250059
一般情况下,我们使用Runnable作为基本的任务表示形式,但是Runnable是一种有很大局限的抽象,run方法中只能记录日志,打印,或者把数据汇总入某个容器(一方面内存消耗大,另一方面需要控制同步,效率很大的限制),总之不能返回执行的结果;比如同时1000个任务去网络上抓取数据,然后将抓取到的数据进行处理(处理方式不定),我觉得最好的方式就是提供回调接口,把处理的方式最为回调传进去;但是现在我们有了更好的方式实现:CompletionService + Callable
Callable的call方法可以返回执行的结果;
CompletionService将Executor(线程池)和BlockingQueue(阻塞队列)结合在一起,同时使用Callable作为任务的基本单元,整个过程就是生产者不断把Callable任务放入阻塞对了,Executor作为消费者不断把任务取出来执行,并返回结果;
优势:
a、阻塞队列防止了内存中排队等待的任务过多,造成内存溢出(毕竟一般生产者速度比较快,比如爬虫准备好网址和规则,就去执行了,执行起来(消费者)还是比较慢的)
b、CompletionService可以实现,哪个任务先执行完成就返回,而不是按顺序返回,这样可以极大的提升效率;
1、CompletionService : Executor + BlockingQueue
下面看个例子:
package com.zhy.concurrency.completionService; import java.util.Random; import java.util.concurrent.BlockingQueue; import java.util.concurrent.Callable; import java.util.concurrent.CompletionService; import java.util.concurrent.ExecutionException; import java.util.concurrent.ExecutorCompletionService; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; import java.util.concurrent.Future; import java.util.concurrent.LinkedBlockingDeque; /** * 将Executor和BlockingQueue功能融合在一起,可以将Callable的任务提交给它来执行, 然后使用take()方法获得已经完成的结果 * * @author zhy * */ public class CompletionServiceDemo { public static void main(String[] args) throws InterruptedException, ExecutionException { /** * 内部维护11个线程的线程池 */ ExecutorService exec = Executors.newFixedThreadPool(11); /** * 容量为10的阻塞队列 */ final BlockingQueue<Future<Integer>> queue = new LinkedBlockingDeque<Future<Integer>>( 10); //实例化CompletionService final CompletionService<Integer> completionService = new ExecutorCompletionService<Integer>( exec, queue); /** * 模拟瞬间产生10个任务,且每个任务执行时间不一致 */ for (int i = 0; i < 10; i++) { completionService.submit(new Callable<Integer>() { @Override public Integer call() throws Exception { int ran = new Random().nextInt(1000); Thread.sleep(ran); System.out.println(Thread.currentThread().getName() + " 休息了 " + ran); return ran; } }); } /** * 立即输出结果 */ for (int i = 0; i < 10; i++) { try { //谁最先执行完成,直接返回 Future<Integer> f = completionService.take(); System.out.println(f.get()); } catch (InterruptedException e) { e.printStackTrace(); } catch (ExecutionException e) { e.printStackTrace(); } } exec.shutdown(); } }输出结果:
pool-1-thread-4 休息了 52 52 pool-1-thread-1 休息了 59 59 pool-1-thread-10 休息了 215 215 pool-1-thread-9 休息了 352 352 pool-1-thread-5 休息了 389 389 pool-1-thread-3 休息了 589 589 pool-1-thread-2 休息了 794 794 pool-1-thread-7 休息了 805 805 pool-1-thread-6 休息了 909 909 pool-1-thread-8 休息了 987 987
最先执行完成的直接返回,并不需要按任务提交的顺序执行,如果需要写个高并发的程序,且每个任务需要返回执行结果,这是个相当不错的选择!
2、ExecutorService.invokeAll
ExecutorService的invokeAll方法也能批量执行任务,并批量返回结果,但是呢,有个我觉得很致命的缺点,必须等待所有的任务执行完成后统一返回,一方面内存持有的时间长;另一方面响应性也有一定的影响,毕竟大家都喜欢看看刷刷的执行结果输出,而不是苦苦的等待;
下面看个例子:
package com.zhy.concurrency.executors; import java.util.ArrayList; import java.util.List; import java.util.Random; import java.util.concurrent.Callable; import java.util.concurrent.ExecutionException; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; import java.util.concurrent.Future; public class TestInvokeAll { public static void main(String[] args) throws InterruptedException, ExecutionException { ExecutorService exec = Executors.newFixedThreadPool(10); List<Callable<Integer>> tasks = new ArrayList<Callable<Integer>>(); Callable<Integer> task = null; for (int i = 0; i < 10; i++) { task = new Callable<Integer>() { @Override public Integer call() throws Exception { int ran = new Random().nextInt(1000); Thread.sleep(ran); System.out.println(Thread.currentThread().getName()+" 休息了 " + ran ); return ran; } }; tasks.add(task); } long s = System.currentTimeMillis(); List<Future<Integer>> results = exec.invokeAll(tasks); System.out.println("执行任务消耗了 :" + (System.currentTimeMillis() - s) +"毫秒"); for (int i = 0; i < results.size(); i++) { try { System.out.println(results.get(i).get()); } catch (Exception e) { e.printStackTrace(); } } exec.shutdown(); } }
执行结果:
pool-1-thread-10 休息了 1 pool-1-thread-5 休息了 59 pool-1-thread-6 休息了 128 pool-1-thread-1 休息了 146 pool-1-thread-3 休息了 158 pool-1-thread-7 休息了 387 pool-1-thread-9 休息了 486 pool-1-thread-8 休息了 606 pool-1-thread-4 休息了 707 pool-1-thread-2 休息了 817 执行任务消耗了 :819毫秒 146 817 158 707 59 128 387 606 486 1
我特意在任务提交完成打印了一个时间,然后invokeAll执行完成后打印了下时间,可以看出invokeAll返回是等待所有线程执行完毕的。这点来说,我觉得可用性不如CompletionService。
嗯,对于批量执行任务,且携带返回结果的案例就到这里~如果有疑问或者代码中存在错误请指出~
来自: http://blog.csdn.net//lmj623565791/article/details/27250059