欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Java线程池简介

程序员文章站 2022-05-04 17:53:06
...

介绍

线程池的作用就是提供一种对线程的管理,避免由于过多的创建和销毁线程所造成的开销。在一个“池”中维护着一定数量的线程,达到可重复利用的效果。在Java中,线程池的实现主要是通过ThreadPoolExecutor来实现的。接下来先从类图结构来分析一下。

Java线程池简介

public interface Executor {
    void execute(Runnable command);
}

在这看得出Executor是一个顶层的接口,里边只有execute方法。这个接口的目的就是表明需要执行一个Runnable任务。

java.util.concurrent.ExecutorService直接继承至Executor,但是依然是一个接口,只是在此基础上增加了其他的方法。

<T> Future<T> submit(Callable<T> task);

submit方法主要就是接受Callable接口的参数,不再是Runnable参数了,而且增加了返回值Future。 
在ExecutorService类中还有好几个重载函数。这几个方法的设计主要是为了让执行任务者能够得到任务的运行结果。

void shutdown();

这个方法主要是提供了关闭线程池的操作,调用此方法后,线程池不再接收新的任务,但是会把当前缓存队列的任务全部执行完毕。

List<Runnable> shutdownNow();

这个方法调用后,不但不能接收新的任务,也会尝试中断正在执行的任务,同时不再执行缓存队列中的任务。

<T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks) throws InterruptedException;

这个方法提供执行一系列的任务的功能,最后返回所有任务的Future对象,用于活动任务的执行结果。

AbstractExecutorService 
它是一个抽象类,实现了ExecutorService接口。对其中绝大部分的方法进行了实现。

public <T> Future<T> submit(Callable<T> task) {
        if (task == null) throw new NullPointerException();
        RunnableFuture<T> ftask = newTaskFor(task);
        execute(ftask);
        return ftask;
    }

任务为空直接返回空指针异常,新建一个ftask对象,最终还是调用了execute方法去执行任务。现在追踪一下newTaskFor方法

protected <T> RunnableFuture<T> newTaskFor(Callable<T> callable) {
        return new FutureTask<T>(callable);
    }

返回的是一个FutureTask对象,这个类即实现了Runnable接口又实现了Callable接口,这样它既可以当作线程的执行对象又可以对任务执行后的结果进行获取。(为了不脱离主线,暂时就不再分析FutureTask的源码了)

public <T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks)
        throws InterruptedException {
        if (tasks == null)
            throw new NullPointerException();
        ArrayList<Future<T>> futures = new ArrayList<Future<T>>(tasks.size());
        boolean done = false;
        try {
            for (Callable<T> t : tasks) {
                RunnableFuture<T> f = newTaskFor(t);
                futures.add(f);
                execute(f);
            }
            for (int i = 0, size = futures.size(); i < size; i++) {
                Future<T> f = futures.get(i);
                if (!f.isDone()) {
                    try {
                        f.get();
                    } catch (CancellationException ignore) {
                    } catch (ExecutionException ignore) {
                    }
                }
            }
            done = true;
            return futures;
        } finally {
            if (!done)
                for (int i = 0, size = futures.size(); i < size; i++)
                    futures.get(i).cancel(true);
        }
    }

首先创建用于存储结果的集合futures,大小为传入的任务数(一个任务对应一个future对象)。然后遍历所有的Callable对象,把它们封装到RunnableFuture中(实际传入的是futureTask对象),然后把创建的futureTask对象加入到结果集futures中,然后调用execute方法去依次执行传入的任务。 
接下来又是一个for循环,在其中去保证每个任务已经执行完毕,当判断某一个任务if (!f.isDone())没有完成时,会调用f.get(),这个方法是一个阻塞方法,也就是说当前线程会一直等到任务执行结束才会返回。这样保证了所有的任务都会在这个for循环中全部执行完毕,然后返回futures结果集。 
此抽象类中并没有实现execute、shutdown、shutdownNow等方法,具体的实现放在了ThreadPoolExecutor中。

ThreadPoolExecutor 这个类继承自AbstractExecutorService ,实现了execute方法。引入了线程池的管理。

public ThreadPoolExecutor(int corePoolSize,
		      int maximumPoolSize,
		      long keepAliveTime,
		      TimeUnit unit,
		      BlockingQueue<Runnable> workQueue,
		      ThreadFactory threadFactory,
		      RejectedExecutionHandler handler) {
        if (corePoolSize < 0 ||
            maximumPoolSize <= 0 ||
            maximumPoolSize < corePoolSize ||
            keepAliveTime < 0)
            throw new IllegalArgumentException();
        if (workQueue == null || threadFactory == null || handler == null)
            throw new NullPointerException();
        this.corePoolSize = corePoolSize;
        this.maximumPoolSize = maximumPoolSize;
        this.workQueue = workQueue;
        this.keepAliveTime = unit.toNanos(keepAliveTime);
        this.threadFactory = threadFactory;
        this.handler = handler;
}
  • corePoolSize 

指的就是线程池的核心线程数。当当前线程池中的线程个数小于corePoolSize时,对新来的任务,直接开启一个新的线程去执行它。

  • maximumPoolSize 

代表最大能够容纳的线程数量。当线程池中的线程个数大于等于corePoolSize后,当需要执行一个新的任务时会先把任务放入缓存队列中,等待后续空闲的线程去执行。如果此时缓存队列已满,那么就会新启一个线程去执行它,如果线程数量已经超过了maximumPoolSize,那么就会调用reject方法,拒绝执行该次任务(后边会分析reject方法)。

  • keepAliveTime 

用于指定线程存活的时间,当线程池中的线程大于corePoolSize后,会监控每一个线程的空闲时间,如果某个线程的空闲时间大于keepAliveTime,那么就会销毁该线程,释放资源。

  • unit 

这个是keepAliveTime的单位,可以为秒、毫秒等等。

  • workQueue 

这个就是我们的任务缓存队列了。是一个阻塞队列的类型,常用的有ArrayBlockingQueue、LinkedBlockingQueue(默认容量是Integer.MAX_VALUE)和SynchronousQueue。

  • threadFactory 

这个就是创建线程的工厂类。用于新建线程实体。

  • handler 

这是拒绝某个任务的回调。当线程池不能够处理某个任务时,会通过调用handler.rejectedExecution()去处理。内置了四种策略 
AbortPolicy(默认情况):直接丢弃,并且抛出RejectedExecutionException异常。 
DiscardPolicy:直接丢弃,不做任何处理。 
DiscardOldestPolicy:从缓存队列丢弃最老的任务,然后调用execute立刻执行该任务。 
CallerRunsPolicy:在调用者的当前线程去执行这个任务。

不同的参数组合就可以实现不同需求的线程池,当然Java中已经为我们内置了很多常用的线程池,它们全部位于Executors类当中。如果没有特殊需求,建议直接使用其中的线程池。 

接下来,我们可以分析一下ThreadPoolExecutor 的execute函数

public void execute(Runnable command) {
        if (command == null)
            throw new NullPointerException();
        /*
         * Proceed in 3 steps:
         *
         * 1. If fewer than corePoolSize threads are running, try to
         * start a new thread with the given command as its first
         * task.  The call to addWorker atomically checks runState and
         * workerCount, and so prevents false alarms that would add
         * threads when it shouldn't, by returning false.
         *
         * 2. If a task can be successfully queued, then we still need
         * to double-check whether we should have added a thread
         * (because existing ones died since last checking) or that
         * the pool shut down since entry into this method. So we
         * recheck state and if necessary roll back the enqueuing if
         * stopped, or start a new thread if there are none.
         *
         * 3. If we cannot queue task, then we try to add a new
         * thread.  If it fails, we know we are shut down or saturated
         * and so reject the task.
         */
        int c = ctl.get();
        //当前线程池中的线程数小于核心线程数
        if (workerCountOf(c) < corePoolSize) {
            //如果添加成功,那么方法就结束了。
            if (addWorker(command, true))
                return;
            c = ctl.get();
        }
        //判断线程池是否处于运行状态,且尝试往缓存队列添加任务,如果同时为真
        if (isRunning(c) && workQueue.offer(command)) {
            int recheck = ctl.get();
            //再次判断当前线程池是否处于运行状态(多线程,且没有同步措施)
            if (! isRunning(recheck) && remove(command))
                reject(command);
            else if (workerCountOf(recheck) == 0)
                addWorker(null, false);
        }
        //如果添加失败就需要拒绝此次任务了。
        else if (!addWorker(command, false))
            reject(command);
    }

我们用一张图来解释一下整个流程

Java线程池简介

下面我们介绍四种常见的线程池,java.util.concurrent.Executors工厂类可以创建常见的线程池,通过Executors.newXXX方法即可创建。

FixedThreadPool

public static ExecutorService newFixedThreadPool(int nThreads){
    return new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>());
}

Java线程池简介 
- FixedThreadPool
是一种容量固定的线程池; 
-
阻塞队列采用LinkedBlockingQueue,它是一种*队列; 
-
由于阻塞队列是一个*队列,因此永远不可能拒绝执行任务; 
-
由于采用*队列,实际线程数将永远维持在nThreads,因此maximumPoolSizekeepAliveTime将无效。

CachedThreadPool

public static ExecutorService newCachedThreadPool(){
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS, new SynchronousQueue<Runnable>());
}

Java线程池简介 
- CachedThreadPool
是一种可以无限扩容的线程池; 
- CachedThreadPool
比较适合执行时间片比较小的任务; 
- keepAliveTime
60,意味着线程空闲时间超过60s就会被杀死; 
-
阻塞队列采用SynchronousQueue,这种阻塞队列没有存储空间,意味着只要有任务到来,就必须得有一个工作线程来处理,如果当前没有空闲线程,那么就再创建一个新的线程。

SingleThreadExecutor

public static ExecutorService newSingleThreadExecutor(){
    return new ThreadPoolExecutor(1, 1, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>());
}

Java线程池简介 
- SingleThreadExecutor
只会创建一个工作线程来处理任务。

ScheduledThreadPool

public static ExecutorService newSingleThreadExecutor(){
    return new ThreadPoolExecutor(1, 1, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>());
}

Java线程池简介 
- ScheduledThreadPool
接收SchduledFutureTask类型的任务,提交任务的方式有2种; 
1. scheduledAtFixedRate
 
2. scheduledWithFixedDelay
 
- SchduledFutureTask
接收参数: 
time
:任务开始时间 
sequenceNumber
:任务序号 
period
:任务执行的时间间隔 
-
阻塞队列采用DelayQueue,它是一种*队列; 
- DelayQueue
内部封装了一个PriorityQueue,它会根据time的先后排序,若time相同,则根据sequenceNumber排序; 
-
工作线程执行流程: 
1.
工作线程会从DelayQueue中取出已经到期的任务去执行; 
2.
执行结束后重新设置任务的到期时间,再次放回DelayQueue