深入浅析Node.js单线程模型
node.js采用 事件驱动 和 异步i/o 的方式,实现了一个单线程、高并发的运行时环境,而单线程就意味着同一时间只能做一件事,那么node.js如何利用单线程来实现高并发和异步i/o?本文将围绕这个问题来探讨node.js的单线程模型:
1、高并发
一般来说,高并发的解决方案就是多线程模型,服务器为每个客户端请求分配一个线程,使用同步i/o,系统通过线程切换来弥补同步i/o调用的时间开销,比如apache就是这种策略,由于i/o一般都是耗时操作,因此这种策略很难实现高性能,但非常简单,可以实现复杂的交互逻辑。
而事实上,大多数网站的服务器端都不会做太多的计算,它们只是接收请求,交给其它服务(比如从数据库读取数据),然后等着结果返回再发给客户端。因此,node.js针对这一事实采用了单线程模型来处理,它不会为每个接入请求分配一个线程,而是用一个主线程处理所有的请求,然后对i/o操作进行异步处理,避开了创建、销毁线程以及在线程间切换所需的开销和复杂性。
2、事件循环
node.js 在主线程中维护了一个事件队列,当接收到请求后,就将请求作为一个事件放入该队列中,然后继续接收其他请求。当主线程空闲时(没有请求接入时),就开始循环事件队列,检查队列中是否有要处理的事件,这时要分两种情况:如果是非i/o任务,就亲自处理,并通过回调函数返回到上层调用;如果是i/o任务,就从线程池中拿出一个线程来执行这个事件,并指定回调函数,然后继续循环队列中的其他事件。当线程中的i/o任务完成后,就执行指定的回调函数,并把这个完成的事件放到事件队列的尾部,等待事件循环,当主线程再次循环到该事件时,就直接处理并返回给上层调用。 这个过程就叫事件循环(event loop),如下图所示:
这个图是整个node.js的运行原理,从左到右,从上到下,node.js被分成了四层,分别是应用层、v8引擎层、node api层 和 libuv层,
应用层: 即javascript交互层,常见的就是node.js的模块,比如 http,fs
v8引擎层: 即利用v8引擎来解析javascript语法,进而和下层api交互
nodeapi层: 为上层模块提供系统调用,一般是由c语言来实现,和操作系统进行交互
libuv层: 即event loop,是node.js实现异步的核心,由libuv库来实现,而libuv中的线程池是由操作系统内核接受管理的。
从上述理解来看,node.js的单线程仅仅是指javascript运行在单线程中,而并非node.js是单线程,在node中,无论是linux平台还是windows平台,内部都是通过线程池来完成io操作,而libuv就是针对不同平台的差异性实现了统一调用。
3、事件驱动
总结上面的过程可以发现,node.js的核心是使用事件驱动模式实现了异步i/o,为了更具体、更清晰的理解和接受这个事实,我们用代码来描述node.js的事件驱动模型:
3.1、事件队列
首先,我们需要定义一个事件队列,既然是队列,那就是一个先进先出(fifo)的数据结构,我们用js的数组来描述,如下:
/** * 定义事件队列 * 入队:unshfit() * 出队:pop() * 空队列:length == 0 */ eventqueue:[],
为了方便理解,我们规定:数组的第一个元素是队列的尾部,数组的最后一个元素是队列的头部, unshfit 就是在尾部插入一个元素,pop就是从头部弹出一个元素,这样就实现了一个简单的队列。
3.2、接收请求
定义一个总的入口来接收用户请求,如下所示:
/** * 接收用户请求 * 每一个请求都会进入到该函数 * 传递参数request和response */ processhttprequest:function(request,response){ //定义一个事件对象 var event = createevent({ params:request.params, //传递请求参数 result:null, //存放请求结果 callback:function(){} //指定回调函数 }); //在队列的尾部添加该事件 eventqueue.unshift(event); },
这个函数很简单,就是把用户的请求包装成事件,放到队列里,然后继续接收其他请求。
3.3、事件循环
当主线程处于空闲时就开始循环事件队列,所以,我们再定义一个事件循环的函数:
/** * 事件循环主体,主线程择机执行 * 循环遍历事件队列 * 处理事件 * 执行回调,返回给上层 */ eventloop:function(){ //如果队列不为空,就继续循环 while(this.eventqueue.length > 0){ //从队列的头部拿出一个事件 var event = this.eventqueue.pop(); //如果是io任务 if(isiotask(event)){ //从线程池里拿出一个线程 var thread = getthreadfromthreadpool(); //交给线程处理 thread.handleiotask(event) }else { //非io任务处理后,直接返回结果 var result = handleevent(event); //最终通过回调函数返回给v8,再由v8返回给应用程序 event.callback.call(null,result); } } },
主线程不停的检测事件队列,对于io任务就交给线程池来处理,非io任务就自己处理并返回。
3.4、线程池
线程池接到任务以后,直接处理io操作,比如读取数据库:
当io
/** * 处理io任务 * 完成后将事件添加到队列尾部 * 释放线程 */ handleiotask:function(event){ //当前线程 var curthread = this; //操作数据库 var optdatabase = function(params,callback){ var result = readdatafromdb(params); callback.call(null,result) }; //执行io任务 optdatabase(event.params,function(result){ //返回结果存入事件对象中 event.result = result; //io完成后,将不再是耗时任务 event.isiotask = false; //将该事件重新添加到队列的尾部 this.eventqueue.unshift(event); //释放当前线程 releasethread(curthread) }) }
任务完成以后就执行回调,把请求结果存入事件中,并将该事件重新放入队列中,等待循环,最后释放线程。当主线程再次循环到该事件时,就直接处理了。
4、node.js软肋
以上四步简单描述了node.js事件驱动模型,至此,我们对node.js应该有了一个简单而又清晰的认识,但node.js 并不是什么都能做。
上面提到,如果是i/o任务,nodejs就把任务交给线程池来异步处理,高效简单,因此node.js适合处理i/o密集型任务,但不是所有的任务都是i/o密集型任务,当碰到cpu密集型任务时,就是只用cpu计算的操作,比如要对数据加解密(node.bcrypt.js),数据压缩和解压(node-tar),这时node.js就会亲自处理,一个一个的计算,前面的任务没有执行完,后面的任务只能干等着,如下图所示:
在事件队列中,如果前面的cpu计算任务没有完成,那么后面的任务就会被阻塞,出现响应缓慢的情况,如果操作系统本身就是单核,那也就算了,但现在大部分服务器都是多cpu或多核的,而node.js只有一个eventloop,也只占用一个cpu/内核,当node.js被cpu密集型任务占用,导致其他任务被阻塞时,却还有cpu/内核处理闲置状态,造成资源浪费。因此node.js不适合cpu密集型任务。
5、node.js适用场景
5.1、restful api
这是适合 node 的理想情况,因为您可以构建它来处理数万条连接。它仍然不需要大量逻辑;它本质上只是从某个数据库中查找一些值并将它们组成一个响应。由于响应是少量文本,入站请求也是少量的文本,因此流量不高,一台机器甚至也可以处理最繁忙的公司的 api 需求。
5.2、实时程序
比如聊天服务,聊天应用程序是最能体现 node.js 优点的例子:轻量级、高流量并且能良好的应对跨平台设备上运行密集型数据(虽然计算能力低)。同时,聊天也是一个非常值得学习的用例,因为它很简单,并且涵盖了目前为止一个典型的 node.js 会用到的大部分解决方案。
以上所述是小编给大家介绍的node.js单线程模型,希望对大家有所帮助