java线程池合理设置最大线程数和核心线程数方式
程序员文章站
2022-03-06 13:26:26
目录线程池合理设置最大线程数和核心线程数一开始是这么配置的后来网上查询线程池核心数配置最后我是这么配置的线程池核心线程数与最大线程数的区别线程池策略饱和策略线程池合理设置最大线程数和核心线程数工作中有...
线程池合理设置最大线程数和核心线程数
工作中有这样一个场景,需要处理千万级别的数据的一个算法,大部分是增删查的操作。这个时候就需要使用多线程去处理。
一开始是这么配置的
@configuration @enableasync(proxytargetclass = true)//利用@enableasync注解开启异步任务支持 @componentscan({"com.ctfojt.auditbcarslogo.service"}) //必须加此注解扫描包 public class threadpoolconfig implements asyncconfigurer { @override public executor getasyncexecutor() { threadpooltaskexecutor taskexecutor = new threadpooltaskexecutor(); taskexecutor.setcorepoolsize(10);//核心线程大小 taskexecutor.setmaxpoolsize(20);//最大线程大小 taskexecutor.setqueuecapacity(500);//队列最大容量 //当提交的任务个数大于queuecapacity,就需要设置该参数,但spring提供的都不太满足业务场景,可以自定义一个,也可以注意不要超过queuecapacity即可 taskexecutor.setrejectedexecutionhandler(new threadpoolexecutor.callerrunspolicy()); taskexecutor.setwaitfortaskstocompleteonshutdown(true); taskexecutor.setawaitterminationseconds(10); taskexecutor.setthreadnameprefix("bcarlogo-thread-"); taskexecutor.initialize(); return taskexecutor; } }
这样配置效率很低,一天大概能处理30多万的数据。往后随着插入表的数据越来越多,处理速度也随之降低,跑个一两天之后,差不多能够处理10万多。完全满足不了需求。
后来网上查询线程池核心数配置
大部分都是这样的:
注:io密集型(某大厂实践经验) 核心线程数 = cpu核数 / (1-阻塞系数)或着 cpu密集型:核心线程数 = cpu核数 + 1 io密集型:核心线程数 = cpu核数 * 2
也尝试着这么配置,结果发现效率并不理想,提高不了多少。
最后我是这么配置的
结果效率大大提升,仅用不到一天的数据,就跑完了千万级的数据。
//获取当前机器的核数 public static final int cpunum = runtime.getruntime().availableprocessors(); @override public executor getasyncexecutor() { threadpooltaskexecutor taskexecutor = new threadpooltaskexecutor(); taskexecutor.setcorepoolsize(cpunum);//核心线程大小 taskexecutor.setmaxpoolsize(cpunum * 2);//最大线程大小 taskexecutor.setqueuecapacity(500);//队列最大容量 //当提交的任务个数大于queuecapacity,就需要设置该参数,但spring提供的都不太满足业务场景,可以自定义一个,也可以注意不要超过queuecapacity即可 taskexecutor.setrejectedexecutionhandler(new threadpoolexecutor.callerrunspolicy()); taskexecutor.setwaitfortaskstocompleteonshutdown(true); taskexecutor.setawaitterminationseconds(60); taskexecutor.setthreadnameprefix("bcarlogo-thread-"); taskexecutor.initialize(); return taskexecutor; }
完美的解决了问题!
线程池核心线程数与最大线程数的区别
线程池策略
corepoolsize:核心线程数;maximunpoolsize:最大线程数
每当有新的任务到线程池时,
- 第一步:先判断线程池中当前线程数量是否达到了corepoolsize,若未达到,则新建线程运行此任务,且任务结束后将该线程保留在线程池中,不做销毁处理,若当前线程数量已达到corepoolsize,则进入下一步;
- 第二步:判断工作队列(workqueue)是否已满,未满则将新的任务提交到工作队列中,满了则进入下一步;
- 第三步:判断线程池中的线程数量是否达到了maxumunpoolsize,如果未达到,则新建一个工作线程来执行这个任务,如果达到了则使用饱和策略来处理这个任务。注意: 在线程池中的线程数量超过corepoolsize时,每当有线程的空闲时间超过了keepalivetime,这个线程就会被终止。直到线程池中线程的数量不大于corepoolsize为止。
(由第三步可知,在一般情况下,java线程池中会长期保持corepoolsize个线程。)
饱和策略
当工作队列满且线程个数达到maximunpoolsize后所采取的策略
-
abortpolicy
:默认策略;新任务提交时直接抛出未检查的异常rejectedexecutionexception,该异常可由调用者捕获。 -
callerrunspolicy
:既不抛弃任务也不抛出异常,使用调用者所在线程运行新的任务。 -
discardpolicy
:丢弃新的任务,且不抛出异常。 -
discardoldestpolicy
:调用poll方法丢弃工作队列队头的任务,然后尝试提交新任务 -
自定义策略
:根据用户需要定制。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。
上一篇: Django url反向解析的实现