图解 JavaScript 垃圾回收 — 现代 JavaScript 教程

垃圾回收

对于开发者来讲,JavaScript 的内存管理是自动的、无形的。咱们建立的原始值、对象、函数……这一切都会占用内存。javascript

当咱们再也不须要某个东西时会发生什么?JavaScript 引擎如何发现它并清理它?html

可达性(Reachability)

JavaScript 中主要的内存管理概念是 可达性java

简而言之,“可达”值是那些以某种方式可访问或可用的值。它们必定是存储在内存中的。react

  1. 这里列出固有的可达值的基本集合,这些值明显不能被释放。算法

    比方说:编程

    • 当前函数的局部变量和参数。
    • 嵌套调用时,当前调用链上全部函数的变量与参数。
    • 全局变量。
    • (还有一些内部的)

    这些值被称做 根(roots)微信

  2. 若是一个值能够经过引用或引用链从根访问任何其余值,则认为该值是可达的。编程语言

    比方说,若是局部变量中有一个对象,而且该对象有一个属性引用了另外一个对象,则该对象被认为是可达的。并且它引用的内容也是可达的。下面是详细的例子。函数

在 JavaScript 引擎中有一个被称做 垃圾回收器 的东西在后台执行。它监控着全部对象的状态,并删除掉那些已经不可达的。post

一个简单的例子

这里是一个最简单的例子:

// user 具备对这个对象的引用
let user = {
  name: "John"
};
复制代码

这里的箭头描述了一个对象引用。全局变量 "user" 引用了对象 {name:"John"}(为简洁起见,咱们称它为 John)。John 的 "name" 属性存储一个原始值,因此它被写在对象内部。

若是 user 的值被重写了,这个引用就没了:

user = null;
复制代码

如今 John 变成不可达的了。由于没有引用了,就不能访问到它了。垃圾回收器会认为它是垃圾数据并进行回收,而后释放内存。

两个引用

如今让咱们想象下,咱们把 user 的引用复制给 admin

// user 具备对这个对象的引用
let user = {
  name: "John"
};

let admin = user;
复制代码

如今若是执行刚刚的那个操做:

user = null;
复制代码

……而后对象仍然能够被经过 admin 这个全局变量访问到,因此对象还在内存中。若是咱们又重写了 admin,对象就会被删除。

相互关联的对象

如今来看一个更复杂的例子。这是个家庭:

function marry(man, woman) {
  woman.husband = man;
  man.wife = woman;

  return {
    father: man,
    mother: woman
  }
}

let family = marry({
  name: "John"
}, {
  name: "Ann"
});
复制代码

marry 函数经过让两个对象相互引用使它们“结婚”了,并返回了一个包含这两个对象的新对象。

由此产生的内存结构:

到目前为止,全部对象都是可达的。

如今让咱们移除两个引用:

delete family.father;
delete family.mother.husband;
复制代码

仅删除这两个引用中的一个是不够的,由于全部的对象仍然都是可达的。

可是,若是咱们把这两个都删除,那么咱们能够看到再也没有对 John 的引用了:

对外引用不重要,只有传入引用才可使对象可达。因此,John 如今是不可达的,而且将被从内存中删除,同时 John 的全部数据也将变得不可达。

通过垃圾回收:

没法到达的岛屿

几个对象相互引用,但外部没有对其任意对象的引用,这些对象也多是不可达的,并被从内存中删除。

源对象与上面相同。而后:

family = null;
复制代码

内存内部状态将变成:

这个例子展现了可达性概念的重要性。

显而易见,John 和 Ann 仍然连着,都有传入的引用。可是,这样还不够。

前面说的 "family" 对象已经再也不与根相连,没有了外部对其的引用,因此它变成了一座“孤岛”,而且将被从内存中删除。

内部算法

垃圾回收的基本算法被称为 "mark-and-sweep"。

按期执行如下“垃圾回收”步骤:

  • 垃圾收集器找到全部的根,并“标记”(记住)它们。
  • 而后它遍历并“标记”来自它们的全部引用。
  • 而后它遍历标记的对象并标记 他们的 引用。全部被遍历到的对象都会被记住,以避免未来再次遍历到同一个对象。
  • ……如此操做,直到全部可达的(从根部)引用都被访问到。
  • 没有被标记的对象都会被删除。

例如,使咱们的对象有以下的结构:

咱们能够清楚地看到右侧有一个“没法到达的岛屿”。如今咱们来看看“标记和清除”垃圾收集器如何处理它。

第一步标记全部的根:

而后他们的引用被标记了:

……若是还有引用的话,继续标记:

如今,没法经过这个过程访问到的对象被认为是不可达的,而且会被删除。

咱们还能够将这个过程想象成从根溢出一个巨大的油漆桶,它流经全部引用并标记全部可到达的对象。而后移除未标记的。

这是垃圾收集工做的概念。JavaScript 引擎作了许多优化,使垃圾回收运行速度更快,而且不影响正常代码运行。

一些优化建议:

  • 分代收集 —— 对象被分红两组:“新的”和“旧的”。许多对象出现,完成他们的工做并很快死去,他们能够很快被清理。那些长期存活的对象会变得“老旧”,并且被检查的频次也会减小。
  • 增量收集 —— 若是有许多对象,而且咱们试图一次遍历并标记整个对象集,则可能须要一些时间,并在执行过程当中带来明显的延迟。因此引擎试图将垃圾收集工做分红几部分来作。而后将这几部分会逐一进行处理。这须要他们之间有额外的标记来追踪变化,可是这样会有许多微小的延迟而不是一个大的延迟。
  • 闲时收集 —— 垃圾收集器只会在 CPU 空闲时尝试运行,以减小可能对代码执行的影响。

还有其余垃圾回收算法的优化和风格。尽管我想在这里描述它们,但我必须打住了,由于不一样的引擎会有不一样的调整和技巧。并且,更重要的是,随着引擎的发展,状况会发生变化,因此在没有真实需求的时候,“提早”学习这些内容是不值得的。固然,除非这是一个纯粹的利益关系。我在下面给你提供了一些相关连接。

总结

主要须要掌握的内容:

  • 垃圾回收是自动完成的,咱们不能强制执行或是阻止执行。
  • 当对象是可达状态时,它必定是存在于内存中的。
  • 被引用与可访问(从一个根)不一样:一组相互链接的对象可能总体都不可达。

现代引擎实现了垃圾回收的高级算法。

《The Garbage Collection Handbook: The Art of Automatic Memory Management》(R. Jones 等人著)这本书涵盖了其中一些内容。

若是你熟悉底层(low-level)编程,关于 V8 引擎垃圾回收器的更详细信息请参阅文章 V8 之旅:垃圾回收

V8 博客 还不时发布关于内存管理变化的文章。固然,为了学习垃圾收集,你最好经过学习 V8 引擎内部知识来进行准备,并阅读一个名为 Vyacheslav Egorov 的 V8 引擎工程师的博客。我之因此说 “V8”,由于网上关于它的文章最丰富的。对于其余引擎,许多方法是类似的,但在垃圾收集上许多方面有所不一样。

当你须要底层的优化时,对引擎有深刻了解将颇有帮助。在熟悉了这门编程语言以后,把熟悉引擎做为下一步计划是明智之选。

本文首发于微信公众号「技术漫谈」,欢迎微信搜索关注,订阅更多精彩内容。


现代 JavaScript 教程:开源的现代 JavaScript 从入门到进阶的优质教程。React 官方文档推荐,与 MDN 并列的 JavaScript 学习教程

在线免费阅读:zh.javascript.info


扫描下方二维码,关注微信公众号「技术漫谈」,订阅更多精彩内容。

相关文章
相关标签/搜索