Executor框架(Java并发编程的艺术笔记)
Executor框架简介
Executor框架的两级调度模型
在HotSpot VM的线程模型中,Java线程被一对一映射为本地操作系统线程,Java线程启动时会创建一个本地OS线程;当该Java线程终止时,这个OS线程也会被回收。OS会调度所有线程并将它们分配给可用的CPU。
在上层,Java多线程程序通常把应用分解为若干个任务,然后使用用户级的调度器(Excutor框架)将这些任务映射为固定数量的线程;在底层,OS内核(OSKernel)将这些线程映射到硬件处理器上。
由下图可看出,应用程序通过Executor框架控制上层的调度;而下层的调度由操作系统 内核控制,下层的调度不受应用程序的控制。
Executor框架的结构与成员
Executor框架主要由3大部分组成:
- 任务。包括被执行任务需要实现的接口:Runnable接口或Callable接口
- 任务的执行。包括任务执行机制的核心接口Executor,以及继承自Executor的 ExecutorService接口。Executor框架有两个关键类实现了ExecutorService接口 (ThreadPoolExecutor和ScheduledThreadPoolExecutor)。
- 异步计算的结果。包括接口Future和实现Future接口的FutureTask类
Executor框架包含的主要的类与接口如下所示,
(1)Executor是一个接口,它是Executor框架的基础,它将任务的提交与任务的执行分离。
(2)ThreadPoolExecutor是线程池的核心实现类,用来执行被提交的任务。
(3)ScheduledThreadPoolExecutor是一个实现类,可以在给定的延迟后运行命令,或者定期执行命令。ScheduledThreadPoolExecutor比Timer更灵活,功能更强大。
(4)Future接口和实现Future接口的FutureTask类,代表异步计算的结果。
(5)Runnable接口和Callable接口的实现类,都可以被ThreadPoolExecutor或ScheduledThreadPoolExecutor执行。
Executor框架的使用
(1)主线程首先要创建实现Runnable或者Callable接口的任务对象。工具类Executors可以把一 个Runnable对象封装为一个Callable对象(Executors.callable(Runnable task)或 Executors.callable(Runnable task,Object resule))。
(2)以把Runnable对象直接交给ExecutorService执行(ExecutorService.execute(Runnable command));或者也可以把Runnable对象或Callable对象提交给ExecutorService执行(ExecutorService.submit(Runnable task)或ExecutorService.submit(Callabletask))。
如果执行ExecutorService.submit(…),ExecutorService将返回一个实现Future接口的对象 。由于FutureTask实现了Runnable,程序员也可以创建FutureTask,然后直接交给ExecutorService执行。
(3)主线程可以执行FutureTask.get()方法来等待任务执行完成。主线程也可以执行 FutureTask.cancel(boolean mayInterruptIfRunning)来取消此任务的执行。
Executor框架的主要成员
(1)ThreadPoolExecutor
ThreadPoolExecutor通常使用工厂类Executors来创建。Executors可以创建3种类型的 ThreadPoolExecutor:SingleThreadExecutor、FixedThreadPool和CachedThreadPool。
1)FixedThreadPool
创建使用固定线程数的方法如下。它适用于为满足资源管理,而需要限制当前线程数量的应用场景。如负载较重的服务器。
public static ExecutorService newFixedThreadPool(int nThreads)
public static ExecutorService newFixedThreadPool(int nThreads, ThreadFactory threadFactory)
2)SingleThreadExecutor
创建使用单个线程的方法如下。它适用于需要保证顺序地执行各个任务;并且在任意时间点,不会有多 个线程是活动的应用场景。
public static ExecutorService newSingleThreadExecutor()
public static ExecutorService newSingleThreadExecutor(ThreadFactory threadFactory)
3)CachedThreadPool
创建一个会根据需要而创建新线程的方法如下。它是大小*的线程池,适用于执行很多的短期异步任务的小程序,或者 是负载较轻的服务器。
public static ExecutorService newCachedThreadPool()
public static ExecutorService newCachedThreadPool(ThreadFactory threadFactory)
(2)ScheduledThreadPoolExecutor
ScheduledThreadPoolExecutor通常使用工厂类Executors来创建。Executors可以创建2种类型的ScheduledThreadPoolExecutor:
1)ScheduledThreadPoolExecutor
它适用于需要多个后台线程执行周期任务,同时为了满足资源管理的需求而需要限制后台线程数量的场景。它包含若干个线程
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize)
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize,ThreadFactory factory
2)SingleThreadScheduledExecutor
它适用于需要单个后台线程执行周期任务,同时需要保证顺序地执行各个任务的应用场景。
public static ScheduledExecutorService newSingleThreadScheduledExecutor()
public static ScheduledExecutorService newSingleThreadScheduledExecutor
(ThreadFactory threadFactory)
(3)Future接口
Future接口和实现Future接口的FutureTask类用来表示异步计算的结果。当我们把Runnable 接口或Callable接口的实现类提交(submit)给ThreadPoolExecutor或 ScheduledThreadPoolExecutor时,ThreadPoolExecutor或ScheduledThreadPoolExecutor会向我们 返回一个FutureTask对象。
<T> Future<T> submit(Callable<T> task)
<T> Future<T> submit(Runnable task, T result)
Future<> submit(Runnable task)
注:截止至JDK8为止,Java通过上述API返回的是一个 FutureTask对象。但Java仅仅保证返回的是一个实现了Future接口的对象。在将 来的JDK实现中,返回的可能不一定是FutureTask。
(4)Runnable接口和Callable接口
Runnable接口和Callable接口的实现类,都可以被ThreadPoolExecutor或ScheduledThreadPoolExecutor执行。它们之间的区别是Runnable不会返回结果,而Callable可以返回结果。
可以使用工厂类Executors来把一个 Runnable包装成一个Callable。
public static Callable<Object> callable(Runnable task)
我们也可以把一个Runnable和一个待返回的结果包装成一个Callable
public static <T> Callable<T> callable(Runnable task, T result)
ThreadPoolExecutor详解
Executor框架最核心的类是ThreadPoolExecutor,它是线程池的实现类,主要的参数如下:
- corePool:核心线程数量。 即使没有任务执行,核心线程也会一直存活
- maximumPool:最大线程池的大小。
- keepAliveTime:如果当前线程池中线程数大于corePoolSize,则多余的线程在等待keepAliveTime时间后如果还没有新的线程任务指派给它、它就会被回收。
- BlockingQueue:用来暂时保存任务的工作队列。
- RejectedExecutionHandler:当ThreadPoolExecutor已经关闭或ThreadPoolExecutor已经饱和 时(达到了最大线程池大小且工作队列已满),execute()方法将要调用的Handler。
ThreadPoolExecutor有3种类型·FixedThreadPool,SingleThreadExecutor,CachedThreadPool。下面分别介绍
FixedThreadPool详解
它是可重用固定线程数的线程池,构造它的静态方法如下
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>());
}
FixedThreadPool的corePoolSize和maximumPoolSize参数都被设置为创建FixedThreadPool时指 定的参数nThreads。
当线程池中的线程数大于corePoolSize时,keepAliveTime为多余的空闲线程等待新任务的 最长时间,超过这个时间后多余的线程将被终止。这里把keepAliveTime设置为0L,意味着多余 的空闲线程会被立即终止。
FixedThreadPool的execute()方法说明
- 当前运行的线程少于corePoolSize,则创建新线程执行任务。
- 当前运行的线程数等于corePoolSize,将任务加入LinkedBlockingQueue。
- 线程执行第1步中的任务后,会在循环中反复从LinkedBlockingQueue获取任务来执行。
FixedThreadPool使用*队列LinkedBlockingQueue作为线程池的工作队列(队列的容量为 Integer.MAX_VALUE)。
- 当线程池中的线程数达到corePoolSize后,新任务将在*队列中等待。因此线程池中的线程数不会超过corePoolSize。
- 使用*队列时maximumPoolSize将是一个无效参数
- 使用*队列时keepAliveTime将是一个无效参数
- 由于使用*队列,运行中的FixedThreadPool不会拒绝任务(不会调用RejectedExecutionHandler.rejectedExecution方法)。
SingleThreadExecutor详解
它是使用单个worker线程的Executor,静态构造方法如下:
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>()));
}
corePoolSize和maximumPoolSize被设置为1。其他参数与 FixedThreadPool相同。
SingleThreadExecutor的execute()说明
- 如果当前运行的线程数少于corePoolSize(即线程池中无运行的线程),则创建一个新线程来执行任务。
- 当前线程池中有一个运行的线程,将任务加入入LinkedBlockingQueue。
- 线程执行完第一步的任务后,会在一个无限循环中反复从LinkedBlockingQueue获取任务来 执行。
CachedThreadPool详解
它是一个会根据需要创建新线程的线程池,下面是创建的静态方法。
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
corePoolSize被设置为0,即corePool为空;maximumPoolSize被设置为 Integer.MAX_VALUE,即maximumPool是*的;keepAliveTime设置为60L,表示CachedThreadPool中的空闲线程 如果等待新任务超过60秒后将会被终止。
CachedThreadPool使用没有容量的SynchronousQueue作为线程池的工作队列,但 CachedThreadPool的maximumPool是*的。因此,如果主线程提交任务的速度高于 maximumPool中线程处理任务的速度时,CachedThreadPool会不断创建新线程。极端情况下, CachedThreadPool会因为创建过多线程而耗尽CPU和内存资源。
SynchronousQueue是一个没有容量的阻塞队列。每个插入操作必须等待另一个线程的对应移除操作
CachedThreadPool的execute()方法说明
- 执行SynchronousQueue.offer(Runnable task)。如果当前maximumPool中有空闲线程 正在执行SynchronousQueue.poll(keepAliveTime,TimeUnit.NANOSECONDS),那么空闲线程成功从队列取任务。execute()方法执行完成,否则执行下面步骤。
- 当初始maximumPool为空,或者maximumPool中当前没有空闲线程时,没有线程执行SynchronousQueue.poll(keepAliveTime,TimeUnit.NANOSECONDS)。此时CachedThreadPool会创建一个新线程执行任务,execute()方法执行完成。
- 在上步中新创建的线程执行完任务后,会执行SynchronousQueue.poll(keepAliveTime,TimeUnit.NANOSECONDS),该操作让空闲线程最多再队列中等待60s。
ScheduledThreadPoolExecutor详解
该类继承自ThreadPoolExecutor,主要用来在给定的延迟之后运行任务,或者定期执行任务。
ScheduledThreadPoolExecutor可以在构造函数中指定多个对应的后台线程数,而Timer对应的是单个后台线程。
ScheduledThreadPoolExecutor的运行机制
ScheduledThreadPoolExecutor使用的是支持延时获取元素的*阻塞队列DelayQueue。
ScheduledThreadPoolExecutor执行主要分为两部分:
- 当调用ScheduledThreadPoolExecutor的scheduleAtFixedRate()方法或者scheduleWithFixedDelay()方法时,会向ScheduledThreadPoolExecutor的DelayQueue添加一个实现了 RunnableScheduledFutur接口的ScheduledFutureTask。
- 线程池中的线程从DelayQueue中获取ScheduledFutureTask,然后执行任务。
ScheduledThreadPoolExecutor的实现
ScheduledThreadPoolExecutor会把待调度的任务(ScheduledFutureTask) 放到一个DelayQueue中。
ScheduledFutureTask主要包含3个成员变量:
- long型成员变量time,表示这个任务将要被执行的具体时间。
- long型成员变量sequenceNumber,表示这个任务被添加到ScheduledThreadPoolExecutor中 的序号。
- long型成员变量period,表示任务执行的间隔周期。
DelayQueue封装了一个PriorityQueue(优先级队列),这个PriorityQueue会对队列中的ScheduledFutureTask进行排序。排序时,time小的排在前面(时间早的任务将被先执行)。如果两个 ScheduledFutureTask的time相同,就比较sequenceNumber,sequenceNumber小的排在前面(如果两个任务的执行时间相同,那么先提交的任务将被先执行)。
ScheduledThreadPoolExecutor的任务执行步骤
- 线程1从从DelayQueue中获取已到期的ScheduledFutureTask(DelayQueue.take())。到期任务是指ScheduledFutureTask的time大于等于当前时间,并执行任务。
- 线程1修改ScheduledFutureTask的time变量便为下次将要被执行的时间,并放入DelayQueue中(DelayQueue.add())。
DelayQueue.take()方法
获取任务步骤如下:
- 获取锁
- 获取周期任务,若PriorityQueue为空,当前线程到Condition中等待;否则执行下一步
- 若PriorityQueue头元素的time参数比当前时间大,到Condition中等待直至time时间;否则执行下一步
- 获取PriorityQueue的头元素,若PriorityQueue不为空,则唤醒在Condition中等待的所有线程。
- 释放锁
public E take() throws InterruptedException {
final ReentrantLock lock = this.lock;
lock.lockInterruptibly(); // 1
try {
for (;;) {
E first = q.peek();
if (first == null) {
available.await(); // 2
} else {
long delay = first.getDelay(TimeUnit.NANOSECONDS);
if (delay > 0) {
long tl = available.awaitNanos(delay); // 3
} else {
E x = q.poll(); // 4
assert x != null;
if (q.size() != 0)
available.signalAll(); // 4
return x;
}
}
}
} finally {
lock.unlock(); // 6
}
}
ScheduledThreadPoolExecutor在一个循环中反复执行步骤2,直到线程从队列获取到一个元素后,才退出循环。
DelayQueue.offer()方法
添加任务步骤如下:
- 获取Lock
- 向PriorityQueue添加任务
- 若上一步添加的任务是队列的头元素,则唤醒在Condition中等待的所有线程
- 释放锁
public boolean offer(E e) {
final ReentrantLock lock = this.lock;
lock.lock(); // 1
try {
E first = q.peek();
q.offer(e); // 2
if (first == null || e.compareTo(first) < 0)
available.signalAll(); // 3
return true;
} finally {
lock.unlock(); // 4
}
}
FutureTask详解
FutureTask简介
FutureTask除了实现Future接口外,还实现了Runnable接口。因此,FutureTask可以交给 Executor执行,也可以由调用线程直接执行(FutureTask.run())。当FutureTask.run()方法被执行时,FutureTask有下面3种状态:
- 未启动。FutureTask.run()方法还没有被执行之前,FutureTask处于未启动状态。当创建一 个FutureTask,且没有执行FutureTask.run()方法之前,这个FutureTask处于未启动状态。
- 已启动。FutureTask.run()方法被执行的过程中,FutureTask处于已启动状态。
- 已完成。FutureTask.run()方法执行完后正常结束,或被取消(FutureTask.cancel(…)),或 执行FutureTask.run()方法时抛出异常而异常结束,FutureTask处于已完成状态。
get()方法和cancel()之间的影响
- 当FutureTask处于未启动或已启动状态时,执行FutureTask.get()方法将导致调用线程阻塞。
- 当FutureTask处于已启动状态时,执行FutureTask.cancel(true)方法将以中断执行此任务线程 的方式来试图停止任务;
- 当FutureTask处于已启动状态时,执行FutureTask.cancel(false)方法将 不会对正在执行此任务的线程产生影响(让正在执行的任务运行完成);
- 当FutureTask处于已完 成状态时,执行FutureTask.cancel(…)方法将返回false。
FutureTask的使用
当一个线程需要等待另一个线程把某任务执行完后,他才能继续执行,此时可以用FutureTask。
测试:假设有多个线程执行若干个任务,每个任务最多只被执行一次,且只允许一个线程执行,其他线程需等待这个任务执行完后,才能继续执行。这些若干任务存储在currentHashMap
final ConcurrentHashMap<Object, Future<String>> taskCache = new ConcurrentHashMap<>();
String executionTask(final String taskName) throws Exception{
while (true) {
Future<String> future = taskCache.get(taskName); // 1.1 2.1
if(future == null) {
Callable<String> task = new Callable<String>() {
@Override
public String call() throws Exception {
return taskName;
}
};
FutureTask<String> futureTask = new FutureTask<String>(task); // 1.2
future = taskCache.putIfAbsent(taskName, future); // 1.3
if(future == null) {
futureTask.run(); //1.4
}
}
return future.get(); // 1.5
}
}
代码执行示意图如下。当两个线程试图同时执行同一任务时,假设t1执行1.3后,t2执行2.1,则t2需在2.2中等待,直到t1执行完1.4后,t2才能从FutureTask.get()返回。
FutureTask的实现
FutureTask的实现基于AbstractQueuedSynchronizer(简称为AQS)。java.util.concurrent中 的很多可阻塞类(比如ReentrantLock)都是基于AQS来实现的。基于于AQS实现的同步器包括:ReentrantLock、Semaphore、ReentrantReadWriteLock、 CountDownLatch和FutureTask。
每一个基于AQS实现的同步器都包括两种类型的操作:
- 至少一个基于acquire操作这个操作阻塞调用线程,除非/直到AQS的状态允许这个线程继续 执行。FutureTask的acquire操作为get()/get(long timeout,TimeUnit unit)方法调用。
- ·至少一个release操作。这个操作改变AQS的状态,改变后的状态可允许一个或多个阻塞 线程被解除阻塞。FutureTask的release操作包括run()方法和cancel(…)方法。
FutureTask声明了一个内部私有的继承于AQS的子类 Sync,Sync实现了AQS的tryAcquireShared(int)方法和tryReleaseShared(int)方法,Sync通过这 两个方法来检查和更新同步状态。
如上图所示。FutureTask.get()方法会调用AQS.acquireSharedInterruptibly(int arg)方法,该方法执行过程如下:
- 调用AQS.acquireSharedInterruptibly(int arg)方法,这个方法首先会回调在子类Sync中实 现的tryAcquireShared()方法来判断acquire操作是否可以成功。acquire操作可以成功的条件为: state为执行完成状态RAN或已取消状态CANCELLED,且runner不为null。
- 如果成功则get()方法立即返回。如果失败则到线程等待队列中去等待其他线程执行 release操作。
- 当其他线程执行release操作(比如FutureTask.run()或FutureTask.cancel(…))唤醒当前线 程后,当前线程再次执行tryAcquireShared()将返回正值1,当前线程将离开线程等待队列并唤醒它的后继线程
- 最后返回计算的结果或抛出异常。
FutureTask.run()的执行过程
- 执行在构造函数中指定的任务(Callable.call()))。
- 以原子方式来更新同步状态(调用AQS.compareAndSetState(int expect,int update),设置 state为执行完成状态RAN)。如果这个原子操作成功,就设置代表计算结果的变量result的值为 Callable.call()的返回值,然后调用AQS.releaseShared(int arg)。
- AQS.releaseShared(int arg)首先会回调在子类Sync中实现的tryReleaseShared(arg)来执 行release操作(设置运行任务的线程runner为null,然会返回true);AQS.releaseShared(int arg), 然后唤醒线程等待队列中的第一个线程。
- 。当某个线程执行FutureTask.run()方法或FutureTask.cancel(...)方法时,会唤醒线程等待队列的第一个线程