三、JavaScript 变量、作用域和内存问题
按照 ECMA-262 的定义,JavaScript 的变量与其他语言的变量有很大区别。
JavaScript 变量松散类型的本质,决定了它只是在特定时间用于保存特定值的一个名字而已。
由于不存在定义某个变量必须要保存何种数据类型值的规则,变量的值及其数据类型可以在脚本的生命周期内改变。
尽管从某种角度看,这可能是一个既有趣又强大,同时又容易出问题的特性,但 JavaScript 变量实际的复杂程度还远不止如此。
1、基本类型和引用类型的值
ECMAscript 变量包含两种不同数据类型的值:基本类型值和引用类型值。
基本类型值 指的是简单的数据段。
引用类型值 指那些可能有多个值构成的对象。
将一个值赋给变量时,解析器必须确定这个值是基本类型值还是引用类型值。
5中基本数据类型:Undefined、Null、Boolean、Number、String。这5种基本数据类型是按值访问的,因为可以操作保存在变量中的实际的值。
引用类型的值是保存在内存中的对象。JavaScript 不允许直接访问内存中的位置,也就是说不能直接操作对象的内存空间。在操作对象时,实际上是在操作对象的引用而不是实际的对象。为此,引用类型的值是按引用访问的(这种说法不严谨,当复制保存着对象的某个变量时,操作的是对象的引用。但在为对象添加属性时,操作的是实际的对象)。
1.1、动态的属性
定义基本类型值和引用类型值的方式是类似的:创建一个变量并未该变量赋值。当这个值保存到变量中以后,对于引用类型的值,可以为其添加属性和方法,也可以改变和删除其属性和方法。
var person = new Object();
person.name = 'jack';
console.log(person.name); // name
以上示例,创建了一个对象并将其保存在了变量 person 中。然后,为该对象添加了名为 name 的属性,并将字符串值 'jack' 赋给了这个属性。又通过 console.log() 函数访问了这个新属性。如果对象不被销毁或者这个属性不被删除,这个属性将一直存在。
不能给基本类型的值添加属性,尽管这样做不会导致任何错误。
示例:
var name = 'John';
name.age = 27;
console.log(name.age); // undefined
1.2、复制变量值
从一个变量向另一个变量复制基本类型值和引用类型值是不同的。
当从一个变量向另一个变量复制基本类型的值时,会在变量对象上创建一个新值,然后把该值复制到为新变量分配的位置上。
示例:
var num1 = 5;
var num2 = num1;
num1 中保存的值是 5,当使用 num1 的值来初始化 num2 时, num2 中也保存了值 5,但 num2 中的 5 和 num1 中的 5 是完全独立的,该值只是 num1 中 5 的一个副本。此后,这两个 变量可以参与任何操作而不会互相影响。
当从一个变量向另一个变量复制引用类型的值时,同样也会将存储在变量对象中的值赋值一份放到为新变量分配的空间中。不同是是,这个值的副本实际上是一个指针,而这个指针指向存储在堆中的一个对象。复制操作结束后,两个变量实际上将引用同一个对象。因此,改变其中一个变量,就会影响另一个变量。
var obj1 = new Object();
var obj2 = obj1;
obj1.name = 'John';
console.log(obj2.name); // 'John'
首先,变量 obj1 保存了一个对象的新实例。然后,这个值被复制到了 obj2 中;换句话说,obj1 和 obj2 都指向同一个对象。这样,当为 obj1 添加了 name 属性后,可以通过 obj2 来访问这个属性,因为这两个变量引用的都是同一个对象。
下图展示了保存在变量对象中的变量和保存在堆中的对象之间的关系:
1.3、传递参数
ECMAscript 中所有函数的参数都是按值传递的。也就是说,把函数外部的值复制给函数内部的参数,就和把值从一个变量复制到另一个变量一样。基本类型值的传递如同基本类型变量的复制一样,而引用类型值的传递,则如同引用类型变量的复制一样。
参数是按值传递的:
function setName (obj) {
obj.name = 'John';
obj = new Object();
obj.name = 'Jack';
}
var person = new Object();
setName(person);
console.log(person.name); // 'John'
上述例子说明即使在函数内部修改了参数的值,但原始的引用仍保持不变。实际上,当在函数内部重写 obj 时,这个变量引用的就是一个局部对象。而这个局部对象会在函数执行完毕后立即被销毁。
可以把 ECMAscript 函数的参数想象成局部变量
1.4、检测类型
要检测一个变量是不是基本数据类型, typeof 操作符是最佳工具。更具体一点:typeof 操作符是确定一个变量是字符串、数值、布尔值、undefine 的最佳工具。
如果变量是 对象 或 null, typeof 操作符返回 'object'。
使用 instanceof 操作符检测引用类型值是什么类型的对象。
语法:
result = variable instanceof constructor
如果变量是给定引用类型(根据它的原型链来识别)的实例,那么 instanceof 操作符返回 true
示例:
console.log(person instanceof Object); // 变量 person 是 Object 吗?
console.log(colors instanceof Array); // 变量 colors 是 Array吗?
console.log(pattern instanceof RegExp); // 变量 pattern 是 RegExp吗?
规定:所有引用类型的值都是 Object 的实例。
因此,在检测一个引用类型值和 Object 构造函数时,instanceof 操作符始终都会返回 true。
使用 instanceof 操作符检测基本类型值,始终返回 false。
typeof 操作符检测函数时,会返回 'function'
2、执行环境及作用域
执行环境(execution context,有时也简称 “ 环境 ”)是 JavaScript 中最为重要的一个概念。执行环境定义了变量或函数有权访问的其他数据,决定了它们各自的行为。
每个执行环境都有一个与之关联的变量对象(variable object),环境中定义的所有变量和函数都保存在这个对象中,虽然我们编写的代码无法访问到这个对象,但解析器在处理数据时会在后台使用它。
全局执行环境是最外围的一个执行环境。根据 ECMAscript 实现所在的宿主环境不同,表示执行环境的对象也不一样。在 Web 浏览器中,全局执行环境被认为是 window 对象,因此所有全局变量和函数都是作为 window 对象的属性和方法创建的。某个执行环境中的所有代码执行完毕后,该环境被销毁,保存在其中的所有变量和函数定义也随之销毁(全局执行环境知道应用程序退出——例如关闭网页或浏览器——时才会被销毁)。
每个函数都有自己的执行环境。当执行流进入一个函数时,函数的环境就会被推入一个环境栈中。而在函数执行之后,栈将其环境弹出,把控制权返回给之前的执行环境。
当代码在一个环境中执行时,会创建变量对象的一个作用域链(scope chain)。作用域链的用途,是保证对执行环境有权访问的所有变量和函数的有序访问。作用域的前端,始终都是当前执行的代码所在环境的变量对象。如果这个环境是函数,则将其活动对象(activation Object)作为变量对象。活动对象在最开始是只包含一个变量,即 arguments 对象(这个对象在全局环境中是不存在的)。作用域链中的下一个变量对象来自包含(外部)环境,再下一个变量对象则来自下一个包含环境。这样,一直延续到全局执行环境;全局执行环境的变量对象始终都是作用域链中的最后一个对象。
标识符解析是沿着作用域链一级一级地搜索标识符的过程。搜索过程始终从作用域链的前端开始,逐级地向后回溯,直至找到标识符为止(如果找不到标识符,通常会导致错误发生)。
示例:
var color = blue;
function changeColor () {
if (color === 'blue') {
color = 'red';
} else {
color = 'blue';
}
}
changeColor();
console.log('Color is now ' + color);
在上述例子中,函数 changeColor() 的作用域包含两个对象:它自己的变量对象(其中定义着 arguments 对象)和全局环境的变量对象。可以在函数内部访问变量 color ,就是因为可以在这个作用域链中找到它。
此外,在局部作用域中定义的变量可以在局部环境中与全局变量互换使用,示例:
var color = 'blue';
function changeColor () {
var anotherColor = 'red';
function swapColors () {
var tempColor = anotherColor;
anotherColor = color;
color = tempColor;
// 这里可以访问 color、anotherColor、tempColor
}
// 这里可以访问 color 和 anotherColor,但不能访问 tempColor
swapColors();
}
// 这里只能访问color
changeColor();
上述代码共涉及 3 个执行环境:全局环境、changeColor() 的局部环境和 swapColors() 的局部环境。
全局环境中有一个变量 color 和一个函数 changeColor() 。
changeColor() 的局部环境中有一个名为 anotherColor 的变量和一个名为 swapColors() 的函数,但它也可以访问全局环境中的变量 color。
swapColors() 的局部环境中有一个变量 tempColor,该变量只能在这个环境中访问到,无论全局环境还是 changeColor() 的局部环境都无权访问 tempColor。在 swapColors() 内部则可以访问其他两个环境中的所有变量,因为那两个环境是它的父执行环境。
上面例子的作用域链:
上图中的矩形表示特定的执行环境。内部环境可以通过作用域链访问所有的外部环境,但外部环境不能访问到内部环境中的任何变量和函数。
这些环境之间的联系是线性、有次序的。每个环境都可以向上搜索作用域链,以查询变量和函数名;任何环境都不能通过向下搜索作用域链而进入另一个执行环境。
函数参数也被当作变量来对待,因此其访问规则与执行环境中的其他变量相同。
2.1、延长作用域链
虽然执行环境的类型只有两种——全局和局部(函数),但可以延长作用域链。
有些语句可以作用域链的前端临时增加一个变量对象,该变量会在代码执行后被移除。
当执行流进入下列任何一个语句时,作用域链就会得到加长:
- try-catch 语句的 catch 块
- with 语句
这两个语句都会在作用域链的前端添加一个变量对象。
对 with 语句来说,会将指定的对象添加到作用域链中。
对 catch 语句来说,会创建一个新的变量对象,其中包含的是被抛出的错误对象的声明。
2.2、查询标识符
当在某个环境中为了读取或写入而引用一个标识符时,必须通过搜索来确定该标识符实际代表什么。搜索过程冲作用域链的前端开始,向上逐级查询与给定名字匹配的标识符。如果在局部环境中找到了该标识符,搜索过程停止,变量就绪。如果在局部环境中没有找到该变量名,则继续沿作用域链向上搜索。搜索过程将一直追溯到全局环境的变量对象。如果在全局环境中也没有找到这个标识符,则说明该变量尚未声明。
搜索过程中,如果存在一个局部的变量的定义,搜索就会停止,不再进入另一个变量对象。即,如果局部环境中存在同名标识符,就不会使用位于父环境中的标识符。
3、垃圾收集
JavaScript 具有自动垃圾收集机制,也就是说,执行环境会负责管理代码执行过程中使用的内存。所需内存的分配以及无用内存的回收完全实现了自动管理。
垃圾收集机制原理:找出那些不再继续使用的变量,然后释放其占用的内存。
为此,垃圾收集器会按照固定的时间间隔(或代码执行中预定的收集时间),周期性的执行这一操作。
函数中局部变量的正常生命周期:局部变量只在函数执行的过程中存在。在这个过程中,会为局部变量在栈(或堆)内存上分配相应的空间,以便存储它们的值。然后在函数中使用这些变量,直至函数执行结束。此时,局部变量就没有存在的必要了,因此可以释放它们的内存以共将来使用。
为了判断变量是否有存在的必要,垃圾收集器必须跟踪哪个变量有用,哪个没用,对于不再有用的变量打上标记,以备将来收回其占用的内存。
用于标识无用变量的策略可能会因实现而异,但具体到浏览器中的实现,则通常有两个策略。
- 标记清除
- 引用计数
3.1、标记清除
JavaScript 中最常用的垃圾收集方式是标记清除(mark-and-sweep)。
当变量进入环境(例如,在函数中声明一个变量)时,就将这个变量标记为 “ 进入环境 ”。从逻辑上讲,永远不能释放进入环境的变量所占用的,因为只要执行流进入相应的环境,就可能会用到它们。而当变量离开环境时,则将其标记为 “ 离开环境 ”。
可以使用任何方式来标记变量:
- 可以通过反转某个特殊的位来记录一个变量何时进入环境
- 使用一个 “ 进入环境的 ” 变量列表及一个 “ 离开环境的 ” 变量列表来跟踪哪个变量发生了变化。
说到底,如何标记变量并不重要,关键在于采取什么策略。
垃圾收集器在运行的时候会给存储在内存中的所有变量都加上标记。然后,它会去掉环境中的变量以及被环境中的变量引用的变量的标记。而在此之后再被加上标记的变量将被视为准备删除的变量,原因是环境中的变量以经无法访问到这些变量了。最后,垃圾收集器完成内存清除工作,销毁那些带标记的值并回收它们所占用的内存空间。
3.2、引用计数
另一种不太常见的垃圾收集策略叫引用计数(reference counting)。
引用计数的含义是跟踪记录每个值被引用的次数。当声明了一个变量并将一个引用类型值赋给该变量时,则这个值的引用次数就是 1。如果同一个值又被赋给另一个变量,则该值的引用次数加 1。相反,如果包含对这个值引用的变量有取得了另外一个值,则这个值的引用次数减 1,当这个值的引用次数变成 0 时,则说明没有办法在访问到这个值了,因而就可以将其占用的内存空间回收回来。这样,当垃圾收集器下次再运行时,它就会释放那些引用次数为零的值多占用的内存。
遇到问题:循环引用。
循环引用是指对象 A 中包含一个指向对象 B 的指针,而对象 B 中也包含一个指向对象 A 的引用。示例:
function problem() {
var objectA = new Object();
var objectB = new Object();
objectA.someOtherObject = objectB;
objectB.anotherObject = objectA;
}
在上述例子中,objectA 和 objectB 通过各自的属性相互引用;也就是说,这两个对象的的引用次数都是 2。在采用标记清除策略的实现中,由于函数执行之后,这两个对象都离开了作用域,因此这种相互引用不是个问题。但在采用引用计数策略的实现中,当函数执行完毕后,objectA 和 objectB 还将继续存在,因为它们的引用次数永远不会是 0。假如这个函数被重复多次调用,就会导致大量内存得不到回收。
3.3、性能问题
垃圾收集器是周期性运行的,而且如果为变量分配的内存数量很可观,那么回收工作量也是相当大的。在这种情况下,确定垃圾收集的时间间隔是一个非常重要的问题。
在有的浏览器中可以触发垃圾收集过程,但不建议这样做。
在 IE 中,调用 window.CollectGarbage() 方法会立即执行垃圾收集。
在 Opera 7 及更高版本中,调用 window.opera.collect() 也会启动垃圾收集例程。
3.4、管理内存
使用具备垃圾收集机制的语言编写程序,开发人员一般不必操心内存管理问题。但是,JavaScript 在进行内存管理及垃圾收集时面临的问题还是有点与众不同。其中最主要的一个问题,就是分配给 Web 浏览器的可用内存数量通常要比分配给桌面应用程序的少。这样做的目的主要是出于安全方面的考虑,目的是防止运行 JavaScript 的网页耗尽全部系统内存而导致系统崩溃。内存限制问题不仅会影响给变量分配内存,同时还会影响调用栈以及在一个线程中能够同时执行的语句数量。
因此,确保占用最少的内存可以让页面获得更好的性能。而优化内存占用的最佳方式,就是为执行中的代码只保存必要的数据。一旦数据不再有用,最好通过将其值设置为 null 来释放其引用——这个做法叫做解除引用(dereferencing)。这一做法适用于大多数全局变量和全局对象的属性。局部变量会在它们离开执行环境是自动被解除引用。
示例:
function createPerson(name) {
var localPerson = new Object();
localPerson.name = name;
return localPerson;
}
var globalPerson = createPerson('Nicholas');
// 手工解除 globalPerson 的引用
globalPerson = null;
在上述例子中,变量 globalPerson 取得了 createPerson() 函数的返回值。在 createPerson() 函数内部,我们创建了一个对象并将其赋给局部变量 localPerson,然后又为该对象添加了一个名为 name 的属性。最后,当调用这个函数时,localPerson 以函数值的形式返回并赋给全局变量 globalPerson。由于 localPerson 在 createPerson() 函数执行完毕后就离开了其执行环境,因此无需我们显示地去为它解除引用。但是对于全局变量 globalPerson 而言,则需要我们在不使用它的时候手工为它解除引用,这也是上面例子中最后一行代码的目的。
不过,解除一个值的引用并不意味着自动回收该值所占用的内存。解除引用的真正作用是让值脱离执行环境,以便垃圾收集器下次运行时将其回收。
小结
JavaScript 变量可以用来保存两种类型的值:基本类型值和引用类型值。
基本类型值源自以下 5 中基本数据类型:Undefined、Null、Boolean、Number、String。
基本类型值和引用类型值具有以下特点:
- 基本类型值在内存中占据固定大小的空间,因此被保存在栈内存中。
- 从一个变量向另一个变量复制基本类型的值,会创建这个值的一个副本。
- 引用类型的值是对象,保存在堆内存中。
- 包含引用类型值的变量实际上包含的并不是对象,而是一个指向该对象的指针。
- 从一个变量向另一变量复制引用类型的值,复制的其实是指针,因此两个变量最终都指向同一个对象。
- 确定一个值是那种基本类型可以使用 typeof 操作符,确定一个值是哪种引用类型可以使用 instanceof 操作符。
所有变量(包括基本类型和引用类型)都存在于一个执行环境(也称为作用域)当中,这个执行环境决定了变量的生命周期,以及哪一部分代码可以访问其中的变量。
执行环境:
- 执行环境有全局执行环境(也称为全局环境)和函数执行环境之分。
- 每次进入一个新执行环境,都会创建一个用于搜索变量和函数的作用域链。
- 函数的局部环境不仅有权访问函数作用域中的变量,而且有权访问其包含(父)环境,乃至全局环境。
- 全局环境只能访问在全局环境中定义的变量和函数,而不能之间访问局部环境中的任何数据。
- 变量的执行环境有助于确定应该何时释放内存。
JavaScript 是一门具有自动垃圾收集机制的编程语言,开发人员不必关心内存分配和回收问题。可以对 JavaScript 的垃圾收集例程做如下总结:
- 离开作用域的值将被自动标记为可以回收,因此将在垃圾收集期间被删除。
- “ 标记清除 ” 是目前主流的垃圾收集算法,这种算法的思想是给当前不使用的值加上标记,然后再回收其内存。
- 另一种垃圾收集算法是 “ 引用计数 ”,这种算法的思想是跟踪记录所有值被引用的次数。JavaScript 引擎目前都不再使用这种算法;但在 IE 访问非原生 JavaScript 对象(IE9 以下,如 DOM 元素)时,这种算法仍然可能会导致问题。
- 当代码中存在循环引用现象时,“ 引用计数 ” 算法就会导致问题。
- 解除变量的引用不仅有助于消除循环引用现象,而且对垃圾收集也有好处。为了确保有效地回收内存,应该及时解除不再使用的全局对象、全局对象属性以及循环引用变量的引用。