Javascript是如何运行的？（1）引擎、调用栈、事件循环

2019-03-24 本文已影响0人闹闹吃鱼

写在前面

从公众号建号至今，发了不少技术文，基本上每篇都有提到基础的重要性。

不久前我发了个朋友圈，内容是这样的「学习，应该先学习更好的思维，而不是更多的知识，在一个落后的思维模式里，增加再多的信息量，也只是低水平的重复。」

我向来强调基础知识的重要性，基础打牢了，框架，真的非常容易学

好了，不啰嗦了，步入正题

作为JavaScript使用人员，V8引擎作为一个概念，我想大多数人都听说过，而且绝大多数人也知道JavaScript是一个单线程语言，或者知道JavaScript使用的是回调队列的形式

在这篇文章中，我们来详细解释这些概念，从而来解释JavaScript是如何运行的

希望详细了解了这些内容后，你可以写出更好的非阻塞的代码，并且可以正确的使用JavaScript的API

JavaScript引擎

Google的V8引擎是现在最流行的JavaScript引擎，以Chrome为代表的浏览器，还有Node.js都是使用的V8引擎。

那什么是JavaScript引擎呢？

JavaScript引擎是执行JavaScript代码的程序或解释器。 JavaScript引擎可以实现为标准解释器，或即时编译器，它以某种形式将JavaScript编译为字节码。

咱们不纠结于这个概念，纠结概念不是咱们应该做的事情。但是概念必须熟记，因为概念是长篇大论的论证后得出的精髓。后面的文章中咱们再娓娓道来

下面主要简单描述下JavaScript引擎

一个非常简单的视图，看看引擎包含了什么：

V8引擎由两个主要的组件组成

Memory Heap（内存堆）--内存分配的任务就在这里面完成
Call Stack（调用栈）--这是代码执行时堆栈调用的位置

JavaScript运行时

几乎所有的JavaScript开发人员都使用过浏览器中的API（例如：setTimeout）。

其实这些API都不是由引擎提供的。

那么，这些API是从哪里来的呢？是由宿主提供的。

宿主是指JavaScript的运行环境。运行在浏览器上那么宿主就是指浏览器，运行在Node.js上宿主就是Node

就像前端界大牛winter说的那样，我们应该形成感性的认知：一个JavaScript引擎会常驻在内存中，它等待着宿主把JavaScript代码或者函数传递给它执行

那宿主把JavaScript传递给引擎后，引擎是怎么处理的呢？这就牵扯到调用栈与循环队列了，继续往下看，一个一个的说

调用栈（Call Stack）

先来说说调用栈

JavaScript是一个单线程语言，这意味着它只有一个堆栈，因此，它每次只能完成一件事情。

这个堆栈调用，是一种数据结构，它记录了程序中的位置，如果我们进入函数，如果我们进入一个函数，就将这个函数放在这个栈的顶部，如果我们从函数返回（return），那么就将这个函数从栈的顶部弹出。

我们现在给引擎一串JavaScript代码，看看引擎是怎么执行我们的代码的

function multiply(x, y) {
    return x * y;
}
function printSquare(x) {
    var s = multiply(x, x);
    console.log(s);
}
printSquare(5);

当JavaScript引擎开始执行这个代码时，先会清空栈，栈将会如下图执行：

从图中Step1，我们可以看出，我们之前定义的函数在没有使用的时候，并没有进入栈中。所以未被调用的函数并不会存在栈中。

继续看Step1，我们使用了printSquare，那么就要进入这个函数进去看看它里面到底实现了什么。此时我们就将我们进入的这个函数放到栈的最上方（虽然只有它自己但我们也要这样描述）

我们进入这个函数后，发现这货还调用了别的函数multiply，没办法，只好再进入multiply，也就到了Step2，将multiply放入栈的最顶部

执行完multiply后，将它从栈的顶部丢出去，继续console。log(s)，也就可以看到是Step3

以此类推，直到调用栈清空。JavaScript引擎则将我们的代码执行完毕。

上图栈中的每一步，均被称为堆栈帧（Stack Frame），每一帧都代表着栈的变动

我们再来看看，当抛出错误时，堆栈如何构造跟踪的

当异常发生时，基本上是调用堆栈的状态

function foo() {
    throw new Error('SessionStack will help you resolve crashes :)');
}
function bar() {
    foo();
}
function start() {
    bar();
}
start();

在Chrome浏览器中执行上述代码，将产生以下堆栈跟踪

这个错误信息怎么看呢？从上往下看，这就是一个调用栈的内容，现在处于顶部的函数抛出异常，无法正常的从栈顶部弹出

再来说说堆栈溢出，当达到最大调用栈大小时，就非常容易发生「堆栈溢出」

function foo() {
    foo();
}
foo();

当JavaScript引擎开始执行上述代码时，它开始调用函数foo，并且这个函数还会自己调用自己，还没有任何终止条件。

所以，在执行的每个步骤中，函数会一遍又一遍的添加到调用栈中，就像下图这样：

但是，有些时候，调用堆栈中的函数调用超过调用堆栈的实际大小时，浏览器会采取措施，抛出错误，如下图这样：

在单线程上运行代码非常简单，因为不必考虑多线程环境中出现的复杂场景，比如死锁、读写一致等

但是在单个线程上运行也是非常有限的，由于JavaScript只有一个调用栈，当调用的某个函数，执行的非常缓慢时，我们又该怎么办呢？

并发与事件循环

如果在调用堆栈中有的函数需要花费大量的时间才能处理时，那后面的内容不就卡死了么？

比如说在JavaScript中进行一些复杂的图像处理。问题就在调用栈在执行这个图像处理函数时，它是无法再做任何别的事情的。

这意味着浏览器无法渲染，无法运行任何其它的代码，看起来它就像是卡住了。

并且这还不是唯一的问题，一旦浏览器在调用栈中开始处理大量的任务，浏览器可能就会停止响应，并且大量的浏览器会报错，告诉你当前页面崩溃了

网页都崩掉了，还有用户体验可言么？

如果想网页流程，那么就需要避免此类问题。

那么，我们如何在不阻塞UI并使浏览器无响应的情况下执行繁重的代码呢？这依靠的就是JavaScript的「异步回调」

这时候就牵扯到JavaScript引擎的异步与事件循环

在这儿，我觉得GitHub上用户「@Mavericker-1996」的回答已经说的非常详细到位，在此我就不重复造轮子了，只是略加修改

任务队列

首先我们需要明白以下几件事情：

JS分为同步任务和异步任务
同步任务都在主线程上执行，形成一个调用栈
主线程之外，事件触发线程管理着一个任务队列，只要异步任务有了运行结果，就在任务队列之中放置一个事件
一旦执行栈中的所有同步任务执行完毕（此时JS引擎空闲），系统就会读取任务队列，将可运行的异步任务添加到可执行栈中，开始执行

根据规范，事件循环是通过任务队列的机制来进行协调的。

一个 Event Loop 中，可以有一个或者多个任务队列(task queue)。

一个任务队列便是一系列有序任务(task)的集合，每个任务都有一个任务源(task source)，源自同一个任务源的 task 必须放到同一个任务队列，从不同源来的则被添加到不同队列。 setTimeout/Promise 等API便是任务源，而进入任务队列的是他们指定的具体执行任务。

宏任务

(macro)task（又称之为宏任务），可以理解是每次执行栈执行的代码就是一个宏任务（包括每次从事件队列中获取一个事件回调并放到执行栈中执行）。

浏览器为了能够使得JS内部(macro)task与DOM任务能够有序的执行，会在一个(macro)task执行结束后，在下一个(macro)task 执行开始前，对页面进行重新渲染，流程如下：

(macro)task->渲染->(macro)task->...

(macro)task主要包含：script(整体代码)、setTimeout、setInterval、I/O、UI交互事件、postMessage、MessageChannel、setImmediate(Node.js 环境)

微任务

microtask（又称为微任务），可以理解是在当前 task 执行结束后立即执行的任务。也就是说，在当前task任务后，下一个task之前，在渲染之前。

所以它的响应速度相比setTimeout（setTimeout是task）会更快，因为无需等渲染。也就是说，在某一个macrotask执行完后，就会将在它执行期间产生的所有microtask都执行完毕（在渲染前）。

microtask主要包含：Promise.then、MutaionObserver、process.nextTick(Node.js 环境)

运行机制

在事件循环中，每进行一次循环操作称为 tick，每一次 tick 的任务处理模型是比较复杂的，但关键步骤如下：

执行一个宏任务（栈中没有就从事件队列中获取）
执行过程中如果遇到微任务，就将它添加到微任务的任务队列中
宏任务执行完毕后，立即执行当前微任务队列中的所有微任务（依次执行）
当前宏任务执行完毕，开始检查渲染，然后GUI线程接管渲染
渲染完毕后，JS线程继续接管，开始下一个宏任务（从事件队列中获取）

流程图如下：

Promise和async中的立即执行

我们知道Promise中的异步体现在then和catch中，所以写在Promise中的代码是被当做同步任务立即执行的。而在async/await中，在出现await出现之前，其中的代码也是立即执行的。那么出现了await时候发生了什么呢？

await做了什么？

从字面意思上看await就是等待，await 等待的是一个表达式，这个表达式的返回值可以是一个promise对象也可以是其他值。

很多人以为await会一直等待之后的表达式执行完之后才会继续执行后面的代码。

实际上await是一个让出线程的标志。await后面的表达式会先执行一遍，将await后面的代码加入到microtask中，然后就会跳出整个async函数来执行后面的代码。

由于因为async await 本身就是promise+generator的语法糖。所以await后面的代码是microtask。所以对于本题中的

async function async1() {
    console.log('async1 start');
    await async2();
    console.log('async1 end');
}

等价于

async function async1() {
    console.log('async1 start');
    Promise.resolve(async2()).then(() => {
                console.log('async1 end');
        })
}

写在最后

了解原理，了解执行机制不像学习框架的使用那样简单，是一件略微困难的事情。

因为框架都将这些内容给封装起来了，并不需要我们去进行处理，但是就算我们使用框架，也需要了解执行机制，这样我们书写的代码逻辑顺序才不会出错，得到的结果才能与预期一致。

基于JavaScript的框架，均是建立在此基础之上

本文牵扯内容点较多，有些内容一笔带过了，但并不代表不重要，后面我会逐一细写。

如果对后面的并发与事件循环觉得内容较难理解，可以先看看我之前写的白话入门篇：6分钟看懂Node.js武功精髓

关注微信公众号「闹闹吃鱼」更多有趣的内容等着你哦