node内存泄漏以及定位

AlbertoDevl 8年前
   <h2 style="text-align: center;"><img src="https://simg.open-open.com/show/c1af34b0505e9b06230b322b06930973.jpg"></h2>    <p>之前一次偶然机会发现,react 在server渲染时,当NODE_ENV != production时,会导致内存泄漏。具体issues: <a href="/misc/goto?guid=4959714185952979628" rel="nofollow,noindex">https://github.com/非死book/react/issues/7406</a> 。随着node,react同构等技术地广泛运用,node端内存泄漏等问题应该引起我们的重视。为什么node容易出现内存泄漏以及出现之后应该如何排查,下面通过一个简单的介绍以及例子来说明。</p>    <p>首先,node是基于v8引擎基础上,其内存管理方式与v8一致。下面简单介绍v8的相关内存特效。</p>    <h2><strong>V8内存限制</strong></h2>    <p>node基于V8构建,通过V8的方式进行分配跟管理js对象。V8对内存的使用有限制(老生代内存64位系统下约为1.4G,32位系统下约为0.7G,新生代内存64位系统下约为32MB,32系统下约为16MB)。在这样的限制下,将导致无法操作大内存对象。如果不小心触碰这个界限,就会造成进程退出。</p>    <p>原因:V8在执行垃圾回收时会阻塞JavaScript应用逻辑,直到垃圾回收结束再重新执行JavaScript应用逻辑,这种行为被称为“全停顿”(stop-the-world)。若V8的堆内存为1.5GB,V8做一次小的垃圾回收需要50ms以上,做一次非增量式的垃圾回收甚至要1秒以上。</p>    <p>通过node --max-old-space-size=xxx(单位MB) , node --max-new-space-size=xxx(单位KB) 设置新生代内存以及老生代内存来破解默认的内存限制。</p>    <h2><strong>V8的堆构成</strong></h2>    <p>V8的堆其实并不只是由老生代和新生代两部分构成,可以将堆分为几个不同的区域:</p>    <ul>     <li>新生代内存区:大多数的对象被分配在这里,这个区域很小但是垃圾回特别频繁</li>     <li>老生代指针区:属于老生代,这里包含了大多数可能存在指向其他对象的指针的对象,大多数从新生代晋升的对象会被移动到这里</li>     <li>老生代数据区:属于老生代,这里只保存原始数据对象,这些对象没有指向其他对象的指针</li>     <li>大对象区:这里存放体积超越其他区大小的对象,每个对象有自己的内存,垃圾回收其不会移动大对象</li>     <li>代码区:代码对象,也就是包含JIT之后指令的对象,会被分配在这里。唯一拥有执行权限的内存区</li>     <li>Cell区、属性Cell区、Map区:存放Cell、属性Cell和Map,每个区域都是存放相同大小的元素,结构简单</li>    </ul>    <h2><strong>GC回收类型</strong></h2>    <p><strong>增量式GC</strong></p>    <p>表示垃圾回收器在扫描内存空间时是否收集(增加)垃圾并在扫描周期结束时清空垃圾。</p>    <p><strong>非增量式GC</strong></p>    <p>使用非增量式垃圾收集器时,一收集到垃圾即将其清空。</p>    <p>垃圾回收器只会针对新生代内存区、老生代指针区以及老生代数据区进行垃圾回收。对象首先进入占用空间较少的新生代内存。大部分对象会很快失效,非增量GC直接回收这些少量内存。假如有些对象一段时间内不能被回收,则进去老生代内存区。这个区域则执行不频繁的增量GC,且耗时较长。</p>    <p>那什么时候才会导致内存泄漏的发生呢?</p>    <h2><strong>内存泄漏的途径</strong></h2>    <ul>     <li>内存泄露</li>     <li>缓存</li>     <li>队列消费不及时</li>     <li>作用域未释放<br> Node的内存构成主要是通过V8进行分配的部分和Node自行分配的部分。受V8的垃圾回收限制的主要是V8的堆内存。造成内存泄漏的主要原因:1,缓存;2,队列消费不及时;3,作用域未释放</li>    </ul>    <h2><strong>内存泄漏分析</strong></h2>    <p>查看V8内存使用情况(单位byte)</p>    <pre>  <code class="language-nimrod">process.memoryUsage();        {          ress: 47038464,             heapTotal: 34264656,             heapUsed: 2052866         }</code></pre>    <p>ress:进程的常驻内存部分</p>    <p>heapTotal,heapUsed:V8堆内存信息</p>    <p>查看系统内存使用情况(单位byte)</p>    <pre>  <code class="language-nimrod">os.totalmem()  os.freemem()</code></pre>    <p>返回系统总内存以及闲置内存</p>    <p><strong>查看垃圾回收日志</strong></p>    <pre>  <code class="language-nimrod">node --trace_gc -e "var a = []; for( var i = 0; i < 1000000; i++ ) { a.push(new Array(100)); }" >> gc.log  //输出垃圾回收日志    node --prof //输出node执行时性能日志。 使用windows-tick.processor查看。</code></pre>    <p><strong>分析监控工具</strong></p>    <ul>     <li>v8-profiler 对v8堆内存抓取快照和对cpu进行分析</li>     <li>node-heapdump 对v8堆内存抓取快照</li>     <li>node-mtrace 分析堆栈使用</li>     <li>node-memwatch 监听垃圾回收情况</li>    </ul>    <p>node-memwatch</p>    <pre>  <code class="language-nimrod">memwatch.on('stats',function(info){      console.log(info)  })  memwatch.on('leak',function(info){      console.log(info)  })</code></pre>    <ul>     <li>stats事件:每次进行全堆垃圾回收时,将触发一次stats事件。这个事件将会传递内存统计信息。</li>    </ul>    <pre>  <code class="language-nimrod">{  "num_full_gc": 17, //第几次全栈垃圾回收  "num_inc_gc": 8,   //第几次增量垃圾回收  "heap_compactions": 8, //第几次对老生代进行整理  "estimated_base": 2592568, //预估基数  "current_base": 2592568,  //当前基数  "min": 2499912, //最小  "max": 2592568, //最大   "usage_trend": 0 //使用趋势      }</code></pre>    <p>观察num_full_gc和num_inc_gc反映垃圾回收情况。</p>    <ul>     <li>leak事件:如果经过连续5次垃圾回收后,内存仍然没有被释放,意味着内存泄漏的发生。这个时候会触发一个leak事件。</li>    </ul>    <pre>  <code class="language-nimrod">{ start: Fri, 29 Jun 2012 14:12:13 GMT,  end: Fri, 29 Jun 2012 14:12:33 GMT,  growth: 67984,  reason: 'heap growth over 5 consecutive GCs (20s) - 11.67 mb/hr'  }</code></pre>    <ul>     <li>Heap Diffing 堆内存比较 排查内存溢出代码。</li>    </ul>    <p>下面,我们通过一个例子来演示如何排查定位内存泄漏:</p>    <p>首先我们创建一个导致内存泄漏的例子:</p>    <pre>  <code class="language-nimrod">//app.js  var app = require('express')();  var http = require('http').Server(app);  var heapdump = require('heapdump');    var leakobjs = [];  function LeakClass(){      this.x = 1;  }    app.get('/', function(req, res){      console.log('get /');      for(var i = 0; i < 1000; i++){          leakobjs.push(new LeakClass());      }      res.send('<h1>Hello world</h1>');  });    setInterval(function(){      heapdump.writeSnapshot('./' + Date.now() + '.heapsnapshot');  }, 3000);    http.listen(3000, function(){      console.log('listening on port 3000');  });</code></pre>    <p>这里我们通过设置一个不断增加且不回被回收的数组,来模拟内存泄漏。</p>    <p>通过使用heap-dump模块来定时纪录内存快照,并通过chrome开发者工具profiles来导入快照,对比分析。</p>    <p>我们可以看到,在浏览器访问 localhost:3000 ,并多次刷新后,快照的大小一直在增长,且即使不请求,也没有减小,说明已经发生了泄漏。 <img src="https://simg.open-open.com/show/577b4a9ae896c72b0d7a463aaf8f62e6.png"></p>    <p>接着我们通过过chrome开发者工具profiles, 导入快照。通过设置comparison,对比初始快照,发送请求,平稳,再发送请求这3个阶段的内存快照。可以发现右侧new中LeakClass一直增加。在delta中始终为正数,说明并没有被回收。</p>    <p><img src="https://simg.open-open.com/show/3f3a5e663703ca0e5f0ec0eec2801d91.png"></p>    <h2><strong>小结</strong></h2>    <ul>     <li> <p>针对内存泄漏可以采用植入memwatch,或者定时上报process.memoryUsage内存使用率到monitor,并设置告警阀值进行监控。</p> </li>     <li> <p>当发现内存泄漏问题时,若允许情况下,可以在本地运行node-heapdump,使用定时生成内存快照。并把快照通过chrome Profiles分析泄漏原因。若无法本地调试,在测试服务器上使用v8-profiler输出内存快照比较分析json(需要代码侵入)。</p> </li>     <li> <p>需要考虑在什么情况下开启memwatch/heapdump。考虑heapdump的频度以免耗尽了CPU。 也可以考虑其他的方式来检测内存的增长,比如直接监控process.memoryUsage()。</p>      <ul>       <li> <p>当心误判,短暂的内存使用峰值表现得很像是内存泄漏。如果你的app突然要占用大量的CPU和内存,处理时间可能会跨越数个垃圾回收周期,那样的话memwatch很有可能将之误判为内存泄漏。但是,这种情况下,一旦你的app使用完这些资源,内存消耗就会降回正常的水平。所以需要注意的是持续报告的内存泄漏,而可以忽略一两次突发的警报。</p> </li>      </ul> </li>    </ul>    <p> </p>    <p>来自:http://imweb.io/topic/57cc5a75802d795b425977aa</p>    <p> </p>