Node 性能优化

时间 2019-11-06

原文原文链接

前言

这篇文章也一样发表在个人我的博客中，欢迎访问：Node 性能优化javascript

没有 profile 谈优化都是耍流氓，性能优化的大前提是 profile ，有数据才能找出程序慢在哪里了。
本篇文章主要介绍 Node 后端的性能优化，前端的同窗能够看看 Chrome 的 devtools https://github.com/CN-Chrome-...html

1、Web 应用优化

性能的瓶颈每每在 IO前端

IO 层优化

磁盘 IO 为何慢

计算机里的常见 IO 有：java

CPU 一二级缓存node
内存mysql
硬盘nginx
网络git

硬盘的 IO 开销是很是昂贵的，硬盘 IO 花费的 CPU 时钟周期是内存的 41000000/250 = 164000 倍。github

全部在通常应用中，优化要首先考虑数磁盘 IO , 一般也就是数据层的优化，说到数据库优化，不少人第一时间会想到加索引，可是什么加了索引查询会变快呢？索引要怎么加才合适呢？web

为何索引快

关于索引的原理能够看看这篇文章，索引原理。索引快主要的缘由是：

索引占用空间更小，能够有效减小磁盘 IO 次数。
索引可使用方便快速查询的数据结构，如b+树。

索引怎么加

回到咱们的主题，没有 profile 谈优化都是耍流氓
以 mongo 为例，mongo 是带有慢查询功能的。
MongoDB 查询优化分析这篇文章介绍了如何开启和使用 mongo 的慢查询功能。
开启慢查询收集功能后，使用 db.system.profile.find().pretty() 语句能够查询到哪些语句的查询比较慢。如下面这个查询语句为例：

query new_koala.llbrandomredpackage query: { user_id: "56ddb33e23db696f89fdae2a", status: { $ne: 1 } }

查询条件是 user_id、status 两个，因此给这两个字段加上索引能够提升查询速度。
固然，若是 mongo 没有是先开启慢查询，扫描一下 mongo.log 也是个办法。

grep '[0-9][0-9][0-9]ms' /var/log/mongodb/mongodb.log

这样就能够找出全部查询耗时大于100 ms 的记录。而后再对症下药便可。

缓存大法好，有选择地用。

上文有说到，内存 IO 比磁盘 IO 快很是多，因此使用内存缓存数据是有效的优化方法。经常使用的工具如 redis、memcached 等。
缓存效果显著，因此不少时候一谈到优化，不少人就会想到加缓存，可是使用缓存是有代价的，你须要维护缓存的更新和失效，这是个繁琐的事情，用上了缓存后你会常常碰到缓存没有及时更新带来的问题。
重要的事情说多几遍：
缓存有反作用
缓存有反作用
缓存有反作用

并非全部数据都须要缓存，访问频率高，生成代价比较高的才考虑是否缓存，也就是说影响你性能瓶颈的考虑去缓存。

并且缓存还有 缓存雪崩、缓存穿透 等问题要解决。见缓存穿透与缓存雪崩

静态文件缓存

静态文件如图片、js 文件等具备不变性，是很是适合作缓存的。
常见的静态文件缓存服务有 nginx、vanish 等。

代码层面优化。

合并查询

在代码这一块，常作的事情是将屡次的查询合并为一次，消灭 for 循环，实际上仍是减小数据库查询。例如

for user_id in userIds 
     var account = user_account.findOne(user_id)

这类代码实际上能够改写成：

var user_account_map = {}   // 注意这个对象将会消耗大量内存。
user_account.find(user_id in user_ids).forEach(account){
    user_account_map[account.user_id] =  account
}
for user_id in userIds 
    var account = user_account_map[user_id]

这样就把 N 次的查询合并为一次。
实际上仍是为了减小 IO。

关于过早优化

性能优化的工做作多了之后，每每会陷入一个什么都想着去优化的状态，这样就可能陷入过早优化的深坑中。
这里引用一下其余人的观点
https://www.zhihu.com/questio...

2、内存泄露排查

Node 是基于 V8 这个 js 引擎的，这里咱们了解下 V8 里的内存相关的知识。

V8 的 GC 垃圾回收机制

V8 的内存分代

在 V8 中，主要将内存分为新生代和老生代两代。新生代的对象为存活时间比较短的对象，老生代中的对象为存活时间较长的或常驻内存的对象。

默认状况下，新生代的内存最大值在 64 位系统和 32 位系统上分别为 32 MB 和 16 MB。V8 对内存的最大值在 64 位系统和 32 位系统上分别为 1464 MB 和 732 MB。

为何这样分两代呢？是为了最优的 GC 算法。新生代的 GC 算法 Scavenge 速度快，可是不合适大数据量；老生代针使用 Mark-Sweep（标记清除） & Mark-Compact（标记整理）算法，合适大数据量，可是速度较慢。分别对新旧两代使用更适合他们的算法来优化 GC 速度。

详情参见《深刻浅出 nodejs》5.1 V8 的垃圾回收机制与内存限制

V8 的 GC log

在启动程序的时候添加 --trace_gc 参数，V8 在进行垃圾回收的时候，会将垃圾回收的信息打印出来：

➜  $ node --trace_gc aa.js
...
[94036]       68 ms: Scavenge 8.4 (42.5) -> 8.2 (43.5) MB, 2.4 ms [allocation failure].
[94036]       74 ms: Scavenge 8.9 (43.5) -> 8.9 (46.5) MB, 5.1 ms [allocation failure].
[94036] Increasing marking speed to 3 due to high promotion rate
[94036]       85 ms: Scavenge 16.1 (46.5) -> 15.7 (47.5) MB, 3.8 ms (+ 5.0 ms in 106 steps since last GC) [allocation failure].
[94036]       95 ms: Scavenge 16.7 (47.5) -> 16.6 (54.5) MB, 7.2 ms (+ 1.3 ms in 14 steps since last GC) [allocation failure].
[94036]      111 ms: Mark-sweep 23.6 (54.5) -> 23.2 (54.5) MB, 6.2 ms (+ 15.3 ms in 222 steps since start of marking, biggest step 0.3 ms) [GC interrupt] [GC in old space requested].
...

V8 提供了不少程序启动选项：

启动项	含义
–max-stack-size	设置栈大小
–v8-options	打印 V8 相关命令
–trace-bailout	查找不能被优化的函数，重写
–trace-deopt	查找不能优化的函数

使用 memwatch 模块来检测内存泄露

npm模块 memwatch 是一个很是好的内存泄漏检查工具，让咱们先将这个模块安装到咱们的app中去，执行如下命令：

npm install --save memwatch

而后，在咱们的代码中，添加：

var memwatch = require('memwatch');

而后监听 leak 事件

memwatch.on('leak', function(info) {
 console.error('Memory leak detected: ', info);
});

这样当咱们执行咱们的测试代码，咱们会看到下面的信息：

{
 start: Fri Jan 02 2015 10:38:49 GMT+0000 (GMT),
 end: Fri Jan 02 2015 10:38:50 GMT+0000 (GMT),
 growth: 7620560,
 reason: 'heap growth over 5 consecutive GCs (1s) - -2147483648 bytes/hr'
}
mem

memwatch 发现了内存泄漏！memwatch 断定内存泄漏事件发生的规则以下：

当你的堆内存在5个连续的垃圾回收周期内保持持续增加，那么一个内存泄漏事件被派发

了解更加详细的内容，查看 memwatch

使用 heapdump dump 出 Node 应用内存快照

检测到了内存泄露的时候，咱们须要查看当时内存的状态，heapdump 能够抓下当时内存的快照。

memwatch.on('leak', function(info) {
 console.error(info);
 var file = '/tmp/myapp-' + process.pid + '-' + Date.now() + '.heapsnapshot';
 heapdump.writeSnapshot(file, function(err){
   if (err) console.error(err);
   else console.error('Wrote snapshot: ' + file);
  });
});

运行咱们的代码，磁盘上会产生一些 .heapsnapshot 的文件到/tmp目录下。

使用 Chrome 的开发者工具分析内存消耗

heapdump 提供的内存快照是能够用 Chrome 的开发者工具来查看的。把 .heapsnapshot 文件导入到 Chrome Developer Tools

怎么使用内存分析工具呢？
Chrome开发者工具之JavaScript内存分析
这篇文件详细介绍了如何使用开发者工具来分析内存的使用状况。能够参考，这里就不细说了。

摘取个例子，使用对比视图。
对比视图 demo
这个例子展现了经过对比先后的内存变化来找出内存泄露的缘由，看起来仍是很简单方便的。

可是，理想很美好，现实很残酷。下面展现下平常开发中 dump 下的数据。
使用对比视图：

能够看出 array 是内存增加的主要元凶，但也只能获得这个线索，那具体是那些 array 消耗了内存呢？
点开 array 查看详细信息：

一大堆的匿名数组，没法准确查到具体那些 array 消耗了内存。
主要缘由是后端使用了 sails 这个 web 框架，框架里的代码量比较多，干扰项太多，没法准确地判断是哪些 function 出现了问题。

内存泄露缘由

一般，形成内存泄露的缘由有以下几个。

慎用内存当缓存，非用的话控制好缓存的大小和过时时间，防止出现永远没法释放的问题
队列消费不及时，数组、回调，生产者的速度比消费者速度快，堆积了大量生产者致使没法释放做用域或变量
做用域未释放，没法当即回收的内存有全局变量和闭包，尽可能使用变量赋值为 null|undefined 来触发回收

这部分的详细解释请参考《深刻浅出 nodejs》5.4 内存泄露。

3、优化应用 CPU 瓶颈

上面介绍了 IO 优化，内存优化，使用 Node 作后端的话还会常常碰到 CPU 瓶颈。总所周知，Node 是单线程的，因此对 CPU 密集的运算不是太胜任，因此应该避免使用 Node 来进行 CPU 密集的运算。
那么若是出现了 CPU 类的问题要怎么处理呢？

V8log:

加入 --prof 参数能够在应用结束是收集 log，执行命令以后，会在该目录下产生一个 *-v8.log 的日志文件，咱们能够安装一个日志分析工具 tick

tick 工具分析 log

能够分析每一个 function 的处理时间。

➜  $ sudo npm install tick -g
➜  $ node-tick-processor *-v8.log
[Top down (heavy) profile]:
  Note: callees occupying less than 0.1% are not shown.

  inclusive      self           name
  ticks   total  ticks   total
    426   36.7%      0    0.0%  Function: ~<anonymous> node.js:27:10
    426   36.7%      0    0.0%    LazyCompile: ~startup node.js:30:19
    410   35.3%      0    0.0%      LazyCompile: ~Module.runMain module.js:499:26
    409   35.2%      0    0.0%        LazyCompile: Module._load module.js:273:24
    407   35.1%      0    0.0%          LazyCompile: ~Module.load module.js:345:33
    406   35.0%      0    0.0%            LazyCompile: ~Module._extensions..js module.js:476:37
    405   34.9%      0    0.0%              LazyCompile: ~Module._compile module.js:378:37
...

前端的同窗能够直接在 chrome 里收集 cpu profile 用于分析。

4、使用第三方平台

alinode，基于 Node 运行时的应用性能管理解决方案，笔者没有体验过，不预评价。

5、总结

文章主要介绍的仍是后端开发中如何作性能优化的几种方式：

添加索引
接口缓存
静态文件缓存
合并查询
这几种方法的目的其实都是为了减小 IO。看来 IO 太高是 Node 应用反应慢的主要缘由。

此外，文章也介绍了如何排查处理内存泄露和 CPU 太高的问题。这两类问题是也是影响 Node 性能的一大缘由。

参考：

《深刻浅出 nodejs》朴灵著
MySQL索引原理及慢查询优化
 MongoDB 查询优化分析
 如何用redis/memcache作Mysql缓存层?
缓存穿透与缓存雪崩
 http://www.barretlee.com/blog...
http://www.w3ctech.com/topic/842
https://addyosmani.com/blog/t...
http://m.oschina.net/blog/270248
http://www.cnblogs.com/consta...
http://www.open-open.com/lib/...