案例实战：每日上亿请求量的电商系统，JVM年轻代垃圾回收参数如何优化？

程序员文章站 2023-10-19 11:18:59

出自：http://1t.click/7TJ 目录：案例背景引入特殊的电商大促场景抗住大促的瞬时压力需要几台机器？大促高峰期订单系统的内存使用模型估算内存到底该如何分配？新生代垃圾回收优化之一：Survivor空间够不够新生代对象躲过多少次垃圾回收后进入老年代？多大的对象直接进入老年 ......

出自：http://1t.click/7tj

案例背景引入

特殊的电商大促场景

抗住大促的瞬时压力需要几台机器？

大促高峰期订单系统的内存使用模型估算

内存到底该如何分配？

新生代垃圾回收优化之一：survivor空间够不够

新生代对象躲过多少次垃圾回收后进入老年代？

多大的对象直接进入老年代？

别忘了指定垃圾回收器

今日思考题

1、案例背景引入

按照惯例，我们接下来会用案例驱动来带着大家分析到底该如何在特定场景下，预估系统的内存使用模型。

然后合理优化新生代、老年代、eden和survivor各个区域的内存大小。

接着再尽量优化参数避免新生代的对象进入老年代，尽量让对象留在新生代里被回收掉。

我们这里的背景是电商系统，电商系统其实一般会拆分为很多的子系统独立部署

比如商品系统、订单系统、促销系统、库存系统、仓储系统、会员系统，等等

我们这里就以比较核心的订单系统作为例子来说明。

（提示：食用本案例之前，请务必充分理解专栏之前两周的文章！）

我们的案例背景是每日上亿请求量的电商系统，那么大家可以来推算一下每日上亿请求量的电商系统，他会每日有多少活跃用户？

一般按每个用户平均访问20次来计算，那么上亿请求量，大致需要有500万日活用户。

那么继续来推算一下，这500万的日活用户都是会进来进行大量的浏览，那么多少人会下订单？

这里可以按照10%的付费转化率来计算，每天大概有50万人会下订单，那么大致就是每天会有50万订单。

这50万订单算他集中在每天4小时的高峰期内，那么其实平均下来每秒钟大概也就几十个订单，大家是不是觉得根本没啥可说的？

因为几十个订单的压力下，根本就不需要对jvm多关注，基本上就是每秒钟占用一些新生代内存，隔很久新生代才会满。然后一次minor gc后垃圾对象清理掉，内存就空出来了，几乎无压力。

2、特殊的电商大促场景

但是如果你要是考虑到特殊的电商大促场景，就不会这么想了

因为很多中小型的电商平台，确实平时系统压力其实没那么大，也没太大的高并发，每秒几千并发压力就算是高峰压力了。

但是如果遇到一些大促场景，比如双11什么的，情况就不同了。

假设在类似双11的节日里，零点的时候，很多人等着大促开始就要剁手购物，这个时候，可能在大促开始的短短10分钟内，瞬间就会有50万订单。

那么此时每秒就会有接近1000的下单请求，我们就针对这种大促场景来对订单系统的内存使用模型分析一下。

3、抗住大促的瞬时压力需要几台机器？

那么要抗住大促期间的瞬时下单压力，订单系统需要部署几台机器呢？

基本上可以按3台来算，就是每台机器每秒需要抗300个下单请求。这个也是非常合理的，而且需要假设订单系统部署的就是最普通的标配4核8g机器。

从机器本身的cpu资源和内存资源角度，抗住每秒300个下单请求是没问题的。

但是问题就在于需要对jvm有限的内存资源进行合理的分配和优化，包括对垃圾回收进行合理的优化，让jvm的gc次数尽可能最少，而且尽量避免full gc，这样可以尽可能减少jvm的gc对高峰期的系统新更难的影响。

4、大促高峰期订单系统的内存使用模型估算

背景已经全部说完了，接下来咱们就得来预估订单系统的内存使用模型了.

基本上可以按照每秒钟处理300个下单请求来估算，其实无论是订单处理性能还是并发情况，都跟生产很接近

因为处理下单请求是比较耗时的，涉及很多接口的调用，基本上每秒处理100~300个下单请求是差不多的。

那么每个订单咱们就按1kb的大小来估算，单单是300个订单就会有300kb的内存开销

然后算上订单对象连带的订单条目对象、库存、促销、优惠券等等一系列的其他业务对象，一般需要对单个对象开销放大10倍~20倍。