Netty基础系列(4) --堆外内存与零拷贝
前言
到目前为止,我们知道nio当中有三个最最核心的组件,分别是:selelctor,channel,buffer。在netty基础系列(3) --彻底理解nio 这一篇文章中只是进行了大致的介绍。
我们现在来深入理解一下buffer在 堆内创建内存 和 堆外创建内存 的底层原理,与 零拷贝 的具体实现。
buffer
buffer是一个抽象类,首先我们来看看buffer有哪些实现类。
我们从上面这张截图可以看出,buffer的直接子类有7种。除了java中boolean类型。剩余的7种基本类型都有与之对应的buffer。不同类型的buffer存储的内容也不同,比如说bytebuffer存储的就是byte。intbuffer存储的就是int。不要想得太复杂,把底层想象成数组即可。
接下来我们着重对bytebuffer来进行讲解。理解了一个其他的理解起来都差不多。
首先我们来看bytebuffer的继承关系图
由上面的继承关系图可以看出,bytebuffer的子类有五个,分别为:
heapbytebuffer:代表的是jvm堆内的缓存。 heapbytebufferr: 代表的是jvm堆内的只读缓存。 mappedbytebuffer: 直接缓存的抽象基类。 directbytebuffer: 代表的是操作系统内存的缓存。 directbytebufferr: 代表的是操作系统内存的只读缓存
上面这几个类看名字和我的介绍我想你应该知道有什么区别了,这里其实只分为两大类。
分配在堆内存的缓存和分配在操作系统内存的缓存。
heapbytebuffer
我们首先来看在堆内分配缓存的底层原理。
先来看一段代码。
public static void main(string args[]){ bytebuffer bytebuffer = bytebuffer.allocate(1024); }
我们直接调用bytebuffer的静态方法创建了一个1024个字节的bytebuffer缓存。那么bytebuffer的静态方法allocate()在底层到底做了些什么呢?
我们再来看看bytebuffer类对于静态方法allocate()的实现。
public abstract class bytebuffer extends buffer implements comparable<bytebuffer> { public static bytebuffer allocate(int capacity) { if (capacity < 0) throw new illegalargumentexception(); return new heapbytebuffer(capacity, capacity); } }
没错,就是很简单。直接new了一个heapbytebuffer对象,并指定大小为1024个字节。这里暂时不用管capacity是什么,后面我们会详细的讲解,在这里capacity就是我们传入的1024。
到目前为止,我们已经创建了一个heapbytebuffer对象。我们创建这个对象的意义就是用来对channel进行读写。此时我们内存模型已经变成了如下图所示:
对照着上图我们再来看看之前写的这个方法。
bytebuffer bytebuffer = bytebuffer.allocate(1024);
首先再栈空间的某个栈帧中创建了bytebuffer,接着将其指向堆内存中的对象heapbytebuffer。
好了接下来是我们的重点!!!!
此时操作系统会自动在jvm之外的内存中分配一块内存空间,这部分内存空间的创建和销毁完全由操作系统来管理。我们无需在意。
channel的数据无论是读还是写都是与操作系统分配的这块内存打交道而不是我们的堆内存,当准备读数据的时候,channel将数据读到操作系统分配的内存中,然后再复制到jvm堆内存中的heapbytebuffer对象中。写操作也是如此,当我们修改了heapbytebuffer的数据,会将修改后的数据复制到操作系统分配的内存中,然后再写到channel中。
我们之前学的普通的io操作底层基本上都是如此,我们思考一下,为什么不能直接将channel怼到heapbytebuffer中呢?
没错,如果你有一定的开发经验,一定会想到垃圾回收器。当发送垃圾回收的时候,我们的对象在堆内存中是会发送移动的,移动后内存地址是会改变的,而io操作并不能追踪到你改变后的内存地址。所以只能在jvm外分配内存来操作数据。因为这一块内存从创建到销毁之间都是不会移动的。
directbytebuffer
我们来看看在堆外分配内存是如何实现的。
与前文一样,我们首先来看在操作系统中直接分配内存的底层原理。先来看一段代码。
public static void main(string args[]){ bytebuffer bytebuffer = bytebuffer.allocatedirect(1024); }
与创建堆内缓存类似,我们直接调用bytebuffer的静态方法创建了一个1024个字节的directbytebuffer缓存。那么bytebuffer的静态方法allocatedirect()方法与allocate()方法又有什么区别呢?
我们再来看看bytebuffer类对于静态方法allocatedirect()的实现。
public abstract class bytebuffer extends buffer implements comparable<bytebuffer> { public static bytebuffer allocatedirect(int capacity) { return new directbytebuffer(capacity); } }
这里也是直接new了一个directbytebuffer对象,我们进入该对象的构造函数看看干了些什么
这里调用勒unsafe的allocatememory(size)方法。我们进去后会发现这是一个native方法,底层调用的c语言的代码。就是在操作系统内存中分配了一个我们指定大小的内存用以操作数据。并且记录了这块内存的地址。
此时我们的内存模型如下图所示:
因为内存中这块内存不再是操作系统分配的,而是我们java代码调用native方法,自己分配的内存,并且记录了该内存的地址。所以我们操作数据就不需要再堆内操作可以直接在jvm内存以外的内存操作。此时每次读写操作都节省了两次内存复制操作。
这就是我们大名鼎鼎的zero copy(零拷贝)技术。
总结
其实我们多思考一下,这样的优势大吗?其实channel中io的操作相对于内存的复制来说是慢很多的,即便我们在读写数据的时候多了两次复制的过程对于整体来说影响是不大的。
那么什么时候就会体现出零拷贝的优势呢?有大量并发io操作,并且io操作是短暂完成的。这时由于节省了大量的内存copy操作,这些节省的时间积累下来也是非常可观的。
netty的底层就是用的零拷贝技术,所以netty能做到很好并发,之后我们会分析在netty中零拷贝是如何落实的。