欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

详解Nodejs内存治理

程序员文章站 2022-07-06 07:57:57
s运行的宿主环境不同,相应的对内存治理的要求也不一样,当宿主环境是浏览器时,由于网页的运行时间短,且只运行在用户的机器上(相当于分布式),即使内存使用过多或者存在一定的内存...

s运行的宿主环境不同,相应的对内存治理的要求也不一样,当宿主环境是浏览器时,由于网页的运行时间短,且只运行在用户的机器上(相当于分布式),即使内存使用过多或者存在一定的内存泄漏,也并不会对终端用户产生太大的影响。当宿主环境编程服务器(node)时,情况就大不相同了,本身代码运行在固定的几台机器(集中式)上,而且运行的时间是长时间运行,一旦内存治理不好出现了内存膨胀甚至是内存泄漏的情况的话,就会出现服务器端响应时间变长甚至是服务crash的情况。

nodejs是基于v8构建的,所以在node中使用的javascript对象基本上(buffer就不是)都是通过v8来进行分配和管理的。v8在占用内存大小上做了限制(64位操作系统,单个node进程可使用的最大堆内存大小约为1.5gb)。即使服务器的内存很大,但是由于v8的这种限制,导致node无法充分利用服务器的资源。即便如此,为什么v8要做这样的限制呢?做这样限制的原因其实是与垃圾回收机制相关,以1.5gb的垃圾回收堆内存堆为例,v8做一次小的垃圾回收需要50ms以上,做一次全量的垃圾回收甚至要1s以上,要知道垃圾回收过程中javascript线程是要处于暂停执行的状态,太长的暂行时间对于后端服务的性能是会产生较大影响的,所以出于这方面考虑,v8对堆内存做了限制。即便如此,v8还是提供了可以自定义堆内存大小的方式(--max-old-pace-size),old-space代表老生代、new-space代表新生代。

node --max-old-space-size=xxx index.js //单位为mb
// 之前还可以通过-max-new-space-size来定义新生代堆大小,现在已经不可以了

当由于内存泄漏导致服务器一直频繁重启的时候,建议先调大堆内存大小来为定位问题争取时间,毕竟服务响应慢总比直接返回错误页对于用户而言会更好接受一点。

为什么需要老生代和新生代?

老生代和新生代其实是分代式垃圾回收机制里面的不同的分代,因为没有一种垃圾回收算法能够胜任所有的场景,不同的对象生存周期其实需要不同的回收策略才能达到最好的效果,所以v8采用分代式垃圾回收机制,降对象按的存活时间进行不同的分代,然后对不同分代(新生代、老生代)的内存施以更适合也更好的算法。

新生代中的对象存活时间较短,而老生代中的对象存活时间较长甚至是常驻内存。基于此所以设计的新生代的内存普遍要比老生代的内存小很多,v8中新生代最大内存是32m(64位系统为例),老生代最大内存是1400mb。v8实际使用的堆内存大小是新生代+老生代所用内存之和(1432mb),但是v8最大值其实是比使用的内存对大小额外大了32m(1464mb)

新生代如何做垃圾回收?

新生代的采用名叫scavenge的垃圾回收算法。在scavenge的具体实现中,主要采用了cheney算法,cheney算法通过将新生代堆一分为二,一个使用(from semispace),一个空闲(to semispace)。创建对象的时候,现在from空间中进行分配,当需要进行垃圾回收时,就检查from空间中的存活对象,然后将存活的对象拷贝到to空间,同时清空from空间,并将from和to互换,整个垃圾回收过程中就是将存活对象在两个seispace之间进行复制。对于生命周期短的场景存活对象在整个对象中占比较小,所以scavenge采用的是复制存活的对象,但是scavenge只能利用堆内存一半的空间,这是典型的用空间换时间的体现。

当一个对象经过多次垃圾回收依然存活的话,就会被认为是生命周期较长的对象,一方面新生代堆比较小,另一方面重复复制生命周期长的对象也很没有效率,所以对于生命周期长的对象会被移到老生代中去。新生代对象移动到老生代有两个对象:1.对象是否是生命周期较长的对象(已经经历过垃圾回收)2.to空间使用占比是否超过了25%。限制25%的原因是由于垃圾回收完成后to会变成from,如果不做限制的话可能会出现from很快被用光的情况,出现频繁的垃圾回收,也会影响效率。

老生代如何做垃圾回收?

老生代由于存活对象占较大比重,不适合对存活对象进行操作,使用scavenge算法就不太合适了,因此老生代采用了mark-sweep和mark-compact相结合的方式。

mark-sweep分为标记和清除两个阶段,在标记阶段遍历堆中所有对象,标记活着的对象,然后在清除阶段未被标记的对象将会被清除掉。mark-sweep解决了内存释放的问题但是由于没有像scavenge那样复制对象的操作导致内存碎片化不连续。而mark-compact就是用来解决内存碎片化问题的。mark-compact会将存活的对象往一端移动,移动完成后直接清理掉边界外的内存,这样就有大段的连续可用内存了,但是由于涉及到对象的移动,因此mark-compact的速度要比mark-sweep慢了。v8主要使用mark-sweep,只有当空间不足以对新生代中今生过来的对象进行分配时才使用mark-compact。

垃圾回收过程中会导致应用程序暂停执行,由于新生代本身空间较小,且要复制的存活对象占比也少,因此即便执行全量垃圾回收也影响不大,但是老生代空间很大,存活对象也多,执行一次全量垃圾回收对于应用程序暂停会是一个比较长的时间,因此v8将老生的标记改成了增量更新的方式,使得标记和应用程序交替执行直到标记完成,然后垃圾回收再执行后面的清理工作。注意清理工作并不是增量的。

开发者可以指定强制垃圾回收吗?

答案是可以了,在启动node服务的时候使用--expose-gc flag

$ node --expose-gc file.js

这样全局对象上就有了执行垃圾回收的函数

global.gc();

推荐更安全的写法

function forcegc()
 if (global.gc) {
  global.gc();
 } else {
  console.warn('no gc hook! start your program as `node --expose-gc file.js`.');
 }
}

最后给大家分享一下参考资料: