JavaScript 内存泄露教程
BroderickCo
8年前
<h2>一、什么是内存泄露?</h2> <p>程序的运行需要内存。只要程序提出要求,操作系统或者运行时(runtime)就必须供给内存。</p> <p>对于持续运行的服务进程(daemon),必须及时释放不再用到的内存。否则,内存占用越来越高,轻则影响系统性能,重则导致进程崩溃。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/c5c839ac80e598d535396ed520149066.png"></p> <p>不再用到的内存,没有及时释放,就叫做内存泄露(memory leak)。</p> <p>有些语言(比如 C 语言)必须手动释放内存,程序员负责内存管理。</p> <pre> <code class="language-javascript">char * buffer; buffer = (char*) malloc(42); // Do something with buffer free(buffer);</code></pre> <p>上面是 C 语言代码, malloc 方法用来申请内存,使用完毕之后,必须自己用 free 方法释放内存。</p> <p>这很麻烦,所以大多数语言提供自动内存管理,减轻程序员的负担,这被称为"垃圾回收机制"(garbage collector)。</p> <h2>二、垃圾回收机制</h2> <p>垃圾回收机制怎么知道,哪些内存不再需要呢?</p> <p>最常使用的方法叫做 "引用计数" (reference counting):语言引擎有一张"引用表",保存了内存里面所有的资源(通常是各种值)的引用次数。如果一个值的引用次数是 0 ,就表示这个值不再用到了,因此可以将这块内存释放。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/37a2f866376481bb595bdadac94c19a7.png"></p> <p>上图中,左下角的两个值,没有任何引用,所以可以释放。</p> <p>如果一个值不再需要了,引用数却不为 0 ,垃圾回收机制无法释放这块内存,从而导致内存泄露。</p> <pre> <code class="language-javascript">const arr = [1, 2, 3, 4]; console.log('hello world');</code></pre> <p>上面代码中,数组 [1, 2, 3, 4] 是一个值,会占用内存。变量 arr 是仅有的对这个值的引用,因此引用次数为 1 。尽管后面的代码没有用到 arr ,它还是会持续占用内存。</p> <p>如果增加一行代码,解除 arr 对 [1, 2, 3, 4] 引用,这块内存就可以被垃圾回收机制释放了。</p> <pre> <code class="language-javascript">const arr = [1, 2, 3, 4]; console.log('hello world'); arr = null;</code></pre> <p>上面代码中, arr 重置为 null ,就解除了对 [1, 2, 3, 4] 的引用,引用次数变成了 0 ,内存就可以释放出来了。</p> <p>因此,并不是说有了垃圾回收机制,程序员就轻松了。你还是需要关注内存占用:那些很占空间的值,一旦不再用到,你必须检查是否还存在对它们的引用。如果是的话,就必须手动解除引用。</p> <h2>三、内存泄露的识别方法</h2> <p>怎样可以观察到内存泄露呢?</p> <p>经验法则 是,如果连续五次垃圾回收之后,内存占用一次比一次大,就有内存泄露。这就要求实时查看内存占用。</p> <h3>3.1 浏览器</h3> <p>Chrome 浏览器查看内存占用,按照以下步骤操作。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/23cdab83322cf63e0eeacb8b4ce18f52.png"></p> <ol start="1"> <li>打开开发者工具,选择 Timeline 面板</li> <li>在顶部的 Capture 字段里面勾选 Memory</li> <li>点击左上角的录制按钮。</li> <li>在页面上进行各种操作,模拟用户的使用情况。</li> <li>一段时间后,点击对话框的 stop 按钮,面板上就会显示这段时间的内存占用情况。</li> </ol> <p>如果内存占用基本平稳,接近水平,就说明不存在内存泄露。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/f21afefb4667ef2ed28fa9ba56f62ca1.png"></p> <p>反之,就是内存泄露了。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/f204b25ba5cd2a618565ec689e04a260.png"></p> <h3>3.2 命令行</h3> <p>命令行可以使用 Node 提供的 process.memoryUsage 方法。</p> <pre> <code class="language-javascript">console.log(process.memoryUsage()); // { rss: 27709440, // heapTotal: 5685248, // heapUsed: 3449392, // external: 8772 }</code></pre> <p>process.memoryUsage 返回一个对象,包含了 Node 进程的内存占用信息。该对象包含四个字段,单位是字节, <a href="/misc/goto?guid=4959747426826730014" rel="nofollow,noindex">含义</a> 如下。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/f89d54c5c9e07a0d40b7852ce3d5eee9.png"></p> <ul> <li>rss(resident set size):所有内存占用,包括指令区和堆栈。</li> <li>heapTotal:"堆"占用的内存,包括用到的和没用到的。</li> <li>heapUsed:用到的堆的部分。</li> <li>external: V8 引擎内部的 C++ 对象占用的内存。</li> </ul> <p>判断内存泄露,以 heapUsed 字段为准。</p> <h2>四、WeakMap</h2> <p>前面说过,及时清除引用非常重要。但是,你不可能记得那么多,有时候一疏忽就忘了,所以才有那么多内存泄露。</p> <p>最好能有一种方法,在新建引用的时候就声明,哪些引用必须手动清除,哪些引用可以忽略不计,当其他引用消失以后,垃圾回收机制就可以释放内存。这样就能大大减轻程序员的负担,你只要清除主要引用就可以了。</p> <p>ES6 考虑到了这一点,推出了两种新的数据结构:WeakSet 和WeakMap。它们对于值的引用都是不计入垃圾回收机制的,所以名字里面才会有一个"Weak",表示这是弱引用。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/57d6ae3d5589c1135046eb94c7ee506e.jpg"></p> <p>下面以 WeakMap 为例,看看它是怎么解决内存泄露的。</p> <pre> <code class="language-javascript">const wm = new WeakMap(); const element = document.getElementById('example'); wm.set(element, 'some information'); wm.get(element) // "some information"</code></pre> <p>上面代码中,先新建一个 Weakmap 实例。然后,将一个 DOM 节点作为键名存入该实例,并将一些附加信息作为键值,一起存放在 WeakMap 里面。这时,WeakMap 里面对 element 的引用就是弱引用,不会被计入垃圾回收机制。</p> <p>也就是说,DOM 节点对象的引用计数是 1 ,而不是 2 。这时,一旦消除对该节点的引用,它占用的内存就会被垃圾回收机制释放。Weakmap 保存的这个键值对,也会自动消失。</p> <p>基本上,如果你要往对象上添加数据,又不想干扰垃圾回收机制,就可以使用 WeakMap。</p> <h2>五、WeakMap 示例</h2> <p>WeakMap 的例子很难演示,因为无法观察它里面的引用会自动消失。此时,其他引用都解除了,已经没有引用指向 WeakMap 的键名了,导致无法证实那个键名是不是存在。</p> <p>我一直想不出办法,直到有一天贺师俊老师 提示 ,如果引用所指向的值占用特别多的内存,就可以通过 process.memoryUsage 方法看出来。</p> <p>根据这个思路,网友 vtxf 补充了下面的 例子 。</p> <p>首先,打开 Node 命令行。</p> <pre> <code class="language-javascript">$ node --expose-gc</code></pre> <p>上面代码中, --expose-gc 参数表示允许手动执行垃圾回收机制。</p> <p>然后,执行下面的代码。</p> <pre> <code class="language-javascript">// 手动执行一次垃圾回收,保证获取的内存使用状态准确 > global.gc(); undefined // 查看内存占用的初始状态,heapUsed 为 4M 左右 > process.memoryUsage(); { rss: 21106688, heapTotal: 7376896, heapUsed: 4153936, external: 9059 } > const wm = new WeakMap(); undefined > const b = new Object(); undefined > global.gc(); undefined // 此时,heapUsed 仍然为 4M 左右 > process.memoryUsage(); { rss: 20537344, heapTotal: 9474048, heapUsed: 3967272, external: 8993 } // 在 WeakMap 中添加一个键值对, // 键名为对象 b,键值为一个 5*1024*1024 的数组 > wm.set(b, new Array(5*1024*1024)); WeakMap {} // 手动执行一次垃圾回收 > global.gc(); undefined // 此时,heapUsed 为 45M 左右 > process.memoryUsage(); { rss: 62652416, heapTotal: 51437568, heapUsed: 45911664, external: 8951 } // 解除对象 b 的引用 > b = null; null // 再次执行垃圾回收 > global.gc(); undefined // 解除 b 的引用以后,heapUsed 变回 4M 左右 // 说明 WeakMap 中的那个长度为 5*1024*1024 的数组被销毁了 > process.memoryUsage(); { rss: 20639744, heapTotal: 8425472, heapUsed: 3979792, external: 8956 }</code></pre> <p>上面代码中,只要外部的引用消失,WeakMap 内部的引用,就会自动被垃圾回收清除。由此可见,有了它的帮助,解决内存泄露就会简单很多。</p> <h2>六、参考链接</h2> <ul> <li><a href="/misc/goto?guid=4959747426919489057" rel="nofollow,noindex">Simple Guide to Finding a JavaScript Memory Leak in Node.js</a></li> <li><a href="/misc/goto?guid=4959747427001977511" rel="nofollow,noindex">Understanding Garbage Collection and hunting Memory Leaks in Node.js</a></li> <li><a href="/misc/goto?guid=4959747427090400974" rel="nofollow,noindex">Debugging Memory Leaks in Node.js Applications</a></li> </ul> <p> </p> <p> </p> <p>来自:http://www.ruanyifeng.com/blog/2017/04/memory-leak.html</p> <p> </p>