Js 运行机制和Event Loop
一、为什么javascript是单线程?
javascript语言的一大特点就是单线程,也就是说,同一个时间只能做一件事。那么,为什么javascript不能有多个线程呢?这样能提高效率啊。
javascript的单线程,与它的用途有关。作为浏览器脚本语言,javascript的主要用途是与用户互动,以及操作dom。这决定了它只能是单线程,否则会带来很复杂的同步问题。比如,假定javascript同时有两个线程,一个线程在某个dom节点上添加内容,另一个线程删除了这个节点,这时浏览器应该以哪个线程为准?
所以,为了避免复杂性,从一诞生,javascript就是单线程,这已经成了这门语言的核心特征,将来也不会改变。
为了利用多核cpu的计算能力,html5提出web worker标准,允许javascript脚本创建多个线程,但是子线程完全受主线程控制,且不得操作dom。所以,这个新标准并没有改变javascript单线程的本质。
二、任务队列
单线程就意味着,所有任务需要排队,前一个任务结束,才会执行后一个任务。如果前一个任务耗时很长,后一个任务就不得不一直等着。
如果排队是因为计算量大,cpu忙不过来,倒也算了,但是很多时候cpu是闲着的,因为io设备(输入输出设备)很慢(比如ajax操作从网络读取数据),不得不等着结果出来,再往下执行。
javascript语言的设计者意识到,这时主线程完全可以不管io设备,挂起处于等待中的任务,先运行排在后面的任务。等到io设备返回了结果,再回过头,把挂起的任务继续执行下去。
于是,所有任务可以分成两种,一种是同步任务(synchronous),另一种是异步任务(asynchronous)。同步任务指的是,在主线程上排队执行的任务,只有前一个任务执行完毕,才能执行后一个任务;异步任务指的是,不进入主线程、而进入"任务队列"(task queue)的任务,只有"任务队列"通知主线程,某个异步任务可以执行了,该任务才会进入主线程执行。
具体来说,异步执行的运行机制如下。(同步执行也是如此,因为它可以被视为没有异步任务的异步执行。)
(1)所有同步任务都在主线程上执行,形成一个(execution context stack)。
(2)主线程之外,还存在一个"任务队列"(task queue)。只要异步任务有了运行结果,就在"任务队列"之中放置一个事件。
(3)一旦"执行栈"中的所有同步任务执行完毕,系统就会读取"任务队列",看看里面有哪些事件。那些对应的异步任务,于是结束等待状态,进入执行栈,开始执行。
(4)主线程不断重复上面的第三步。
下图就是主线程和任务队列的示意图。
只要主线程空了,就会去读取"任务队列",这就是javascript的运行机制。这个过程会不断重复。
三、事件和回调函数
"任务队列"是一个事件的队列(也可以理解成消息的队列),io设备完成一项任务,就在"任务队列"中添加一个事件,表示相关的异步任务可以进入"执行栈"了。主线程读取"任务队列",就是读取里面有哪些事件。
"任务队列"中的事件,除了io设备的事件以外,还包括一些用户产生的事件(比如鼠标点击、页面滚动等等)。只要指定过回调函数,这些事件发生时就会进入"任务队列",等待主线程读取。
所谓"回调函数"(callback),就是那些会被主线程挂起来的代码。异步任务必须指定回调函数,当主线程开始执行异步任务,就是执行对应的回调函数。
"任务队列"是一个先进先出的数据结构,排在前面的事件,优先被主线程读取。主线程的读取过程基本上是自动的,只要执行栈一清空,"任务队列"上第一位的事件就自动进入主线程。但是,由于存在后文提到的"定时器"功能,主线程首先要检查一下执行时间,某些事件只有到了规定的时间,才能返回主线程。
四、event loop
主线程从"任务队列"中读取事件,这个过程是循环不断的,所以整个的这种运行机制又称为event loop(事件循环)。
为了更好地理解event loop,请看下图(转引自philip roberts的演讲《help, i'm stuck in an event-loop》)。
上图中,主线程运行的时候,产生堆(heap)和栈(stack),栈中的代码调用各种外部api,它们在"任务队列"中加入各种事件(click,load,done)。只要栈中的代码执行完毕,主线程就会去读取"任务队列",依次执行那些事件所对应的回调函数。
执行栈中的代码(同步任务),总是在读取"任务队列"(异步任务)之前执行。请看下面这个例子。
var req = new xmlhttprequest(); req.open('get', url); req.onload = function (){}; req.onerror = function (){}; req.send();
上面代码中的req.send方法是ajax操作向服务器发送数据,它是一个异步任务,意味着只有当前脚本的所有代码执行完,系统才会去读取"任务队列"。所以,它与下面的写法等价。
var req = new xmlhttprequest(); req.open('get', url); req.send(); req.onload = function (){}; req.onerror = function (){};
也就是说,指定回调函数的部分(onload和onerror),在send()方法的前面或后面无关紧要,因为它们属于执行栈的一部分,系统总是执行完它们,才会去读取"任务队列"。
五、定时器
除了放置异步任务的事件,"任务队列"还可以放置定时事件,即指定某些代码在多少时间之后执行。这叫做"定时器"(timer)功能,也就是定时执行的代码。
定时器功能主要由settimeout()和setinterval()这两个函数来完成,它们的内部运行机制完全一样,区别在于前者指定的代码是一次性执行,后者则为反复执行。以下主要讨论settimeout()。
settimeout()接受两个参数,第一个是回调函数,第二个是推迟执行的毫秒数。
console.log(1); settimeout(function(){console.log(2);},1000); console.log(3);
上面代码的执行结果是1,3,2,因为settimeout()将第二行推迟到1000毫秒之后执行。
如果将settimeout()的第二个参数设为0,就表示当前代码执行完(执行栈清空)以后,立即执行(0毫秒间隔)指定的回调函数。
settimeout(function(){console.log(1);}, 0); console.log(2);
上面代码的执行结果总是2,1,因为只有在执行完第二行以后,系统才会去执行"任务队列"中的回调函数。
总之,settimeout(fn,0)的含义是,指定某个任务在主线程最早可得的空闲时间执行,也就是说,尽可能早得执行。它在"任务队列"的尾部添加一个事件,因此要等到同步任务和"任务队列"现有的事件都处理完,才会得到执行。
html5标准规定了settimeout()的第二个参数的最小值(最短间隔),不得低于4毫秒,如果低于这个值,就会自动增加。在此之前,老版本的浏览器都将最短间隔设为10毫秒。另外,对于那些dom的变动(尤其是涉及页面重新渲染的部分),通常不会立即执行,而是每16毫秒执行一次。这时使用requestanimationframe()的效果要好于settimeout()。
需要注意的是,settimeout()只是将事件插入了"任务队列",必须等到当前代码(执行栈)执行完,主线程才会去执行它指定的回调函数。要是当前代码耗时很长,有可能要等很久,所以并没有办法保证,回调函数一定会在settimeout()指定的时间执行。
六、node.js的event loop
node.js也是单线程的event loop,但是它的运行机制不同于浏览器环境。
请看下面的示意图(作者@busyrich)。
根据上图,node.js的运行机制如下。
(1)v8引擎解析javascript脚本。
(2)解析后的代码,调用node api。
(3)负责node api的执行。它将不同的任务分配给不同的线程,形成一个event loop(事件循环),以异步的方式将任务的执行结果返回给v8引擎。
(4)v8引擎再将结果返回给用户。
除了settimeout和setinterval这两个方法,node.js还提供了另外两个与"任务队列"有关的方法:process.nexttick和setimmediate。它们可以帮助我们加深对"任务队列"的理解。
process.nexttick方法可以在当前"执行栈"的尾部----下一次event loop(主线程读取"任务队列")之前----触发回调函数。也就是说,它指定的任务总是发生在所有异步任务之前。setimmediate方法则是在当前"任务队列"的尾部添加事件,也就是说,它指定的任务总是在下一次event loop时执行,这与settimeout(fn, 0)很像。请看下面的例子(via *)。
process.nexttick(function a() { console.log(1); process.nexttick(function b(){console.log(2);}); }); settimeout(function timeout() { console.log('timeout fired'); }, 0) // 1 // 2 // timeout fired
上面代码中,由于process.nexttick方法指定的回调函数,总是在当前"执行栈"的尾部触发,所以不仅函数a比settimeout指定的回调函数timeout先执行,而且函数b也比timeout先执行。这说明,如果有多个process.nexttick语句(不管它们是否嵌套),将全部在当前"执行栈"执行。
现在,再看setimmediate。
setimmediate(function a() { console.log(1); setimmediate(function b(){console.log(2);}); }); settimeout(function timeout() { console.log('timeout fired'); }, 0);
上面代码中,setimmediate与settimeout(fn,0)各自添加了一个回调函数a和timeout,都是在下一次event loop触发。那么,哪个回调函数先执行呢?答案是不确定。运行结果可能是1--timeout fired--2,也可能是timeout fired--1--2。
令人困惑的是,node.js文档中称,setimmediate指定的回调函数,总是排在settimeout前面。实际上,这种情况只发生在递归调用的时候。
setimmediate(function (){ setimmediate(function a() { console.log(1); setimmediate(function b(){console.log(2);}); }); settimeout(function timeout() { console.log('timeout fired'); }, 0); }); // 1 // timeout fired // 2
上面代码中,setimmediate和settimeout被封装在一个setimmediate里面,它的运行结果总是1--timeout fired--2,这时函数a一定在timeout前面触发。至于2排在timeout fired的后面(即函数b在timeout后面触发),是因为setimmediate总是将事件注册到下一轮event loop,所以函数a和timeout是在同一轮loop执行,而函数b在下一轮loop执行。
我们由此得到了process.nexttick和setimmediate的一个重要区别:多个process.nexttick语句总是在当前"执行栈"一次执行完,多个setimmediate可能则需要多次loop才能执行完。事实上,这正是node.js 10.0版添加setimmediate方法的原因,否则像下面这样的递归调用process.nexttick,将会没完没了,主线程根本不会去读取"事件队列"!
process.nexttick(function foo() { process.nexttick(foo); });
事实上,现在要是你写出递归的process.nexttick,node.js会抛出一个警告,要求你改成setimmediate。
另外,由于process.nexttick指定的回调函数是在本次"事件循环"触发,而setimmediate指定的是在下次"事件循环"触发,所以很显然,前者总是比后者发生得早,而且执行效率也高(因为不用检查"任务队列")。
文章原文: ()
上一篇: fgetcvs在linux的问题
推荐阅读