深刻浅出Node.js(四):Node.js的事件机制

Node.js的事件机制

Node.js在其Github代码仓库(https://github.com/joyent/node)上有着一句短短的介绍:Evented I/O for V8 JavaScript。这句近似广告语的句子却道尽了Node.js自身的特点所在:基于V8引擎实现的事件驱动IO。在本文的这部份内容中,我来揭开这Evented这个关键词的一切奥秘吧。 html

Node.js可以在众多的后端JavaScript技术之中脱颖而出,正是因其基于事件的特色而受到欢迎。拿Rhino来作比较,能够看出Rhino引擎支持的后端JavaScript摆脱不掉其余语言同步执行的影响,致使JavaScript在后端编程与前端编程之间有着十分显著的差异,在编程模型上没法造成统一。在前端编程中,事件的应用十分普遍,DOM上的各类事件。在Ajax大规模应用以后,异步请求更获得普遍的认同,而Ajax亦是基于事件机制的。在Rhino中,文件读取等操做,均是同步操做进行的。在这类单线程的编程模型下,若是采用同步机制,没法与PHP之类的服务端脚本语言的成熟度媲美,性能也没有值得可圈可点的部分。直到Ryan Dahl在2009年推出Node.js后,后端JavaScript才走出其迷局。Node.js的推出,我以为该变了两个情况: 前端

  1. 统一了先后端JavaScript的编程模型。
  2. 利用事件机制充分利用用异步IO突破单线程编程模型的性能瓶颈,使得JavaScript在后端达到实用价值。

有了第二次浏览器大战中的佼佼者V8的适时助力,使得Node.js在短短的两年内达到可观的运行效率,并迅速被你们接受。这一点从Node.js项目在Github上的流行度和NPM上的库的数量可见一斑。 node

至于Node.js为什么会选择Evented I/O for V8 JavaScript的结构和形式来实现,能够参见一下2011年初对做者Ryan Dahl的一次采访:http://bostinno.com/2011/01/31/node-js-interview-4-questions-with-creator-ryan-dahl/ 。 git

事件机制的实现

Node.js中大部分的模块,都继承自Event模块(http://nodejs.org/docs/latest/api/events.html )。Event模块(events.EventEmitter)是一个简单的事件监听器模式的实现。具备addListener/on,once,removeListener,removeAllListeners,emit等基本的事件监听模式的方法实现。它与前端DOM树上的事件并不相同,由于它不存在冒泡,逐层捕获等属于DOM的事件行为,也没有preventDefault()、stopPropagation()、 stopImmediatePropagation() 等处理事件传递的方法。 程序员

从另外一个角度来看,事件侦听器模式也是一种事件钩子(hook)的机制,利用事件钩子导出内部数据或状态给外部调用者。Node.js中的不少对象,大多具备黑盒的特色,功能点较少,若是不经过事件钩子的形式,对象运行期间的中间值或内部状态,是咱们没法获取到的。这种经过事件钩子的方式,可使编程者不用关注组件是如何启动和执行的,只需关注在须要的事件点上便可。 github

var options = {
    host: 'www.google.com',
    port: 80,
    path: '/upload',
    method: 'POST'
};
var req = http.request(options, function (res) {
    console.log('STATUS: ' + res.statusCode);
    console.log('HEADERS: ' + JSON.stringify(res.headers));
    res.setEncoding('utf8');
    res.on('data', function (chunk) {
        console.log('BODY: ' + chunk);
    });
});
req.on('error', function (e) {
    console.log('problem with request: ' + e.message);
});
// write data to request body
req.write('data\n');
req.write('data\n');
req.end();

在这段HTTP request的代码中,程序员只须要将视线放在error,data这些业务事件点便可,至于内部的流程如何,无需过于关注。 数据库

值得一提的是若是对一个事件添加了超过10个侦听器,将会获得一条警告,这一处设计与Node.js自身单线程运行有关,设计者认为侦听器太多,可能致使内存泄漏,因此存在这样一个警告。调用: 编程

emitter.setMaxListeners(0);

能够将这个限制去掉。 后端

其次,为了提高Node.js的程序的健壮性,EventEmitter对象对error事件进行了特殊对待。若是运行期间的错误触发了error事件。EventEmitter会检查是否有对error事件添加过侦听器,若是添加了,这个错误将会交由该侦听器处理,不然,这个错误将会做为异常抛出。若是外部没有捕获这个异常,将会引发线程的退出。 api

事件机制的进阶应用

继承event.EventEmitter

实现一个继承了EventEmitter类是十分简单的,如下是Node.js中流对象继承EventEmitter的例子:

function Stream() {
    events.EventEmitter.call(this);
}
util.inherits(Stream, events.EventEmitter);

Node.js在工具模块中封装了继承的方法,因此此处能够很便利地调用。程序员能够经过这样的方式轻松继承EventEmitter对象,利用事件机制,能够帮助你解决一些问题。

多事件之间协做

在略微大一点的应用中,数据与Web服务器之间的分离是必然的,如新浪微博、Facebook、Twitter等。这样的优点在于数据源统一,而且能够为相同数据源制定各类丰富的客户端程序。以Web应用为例,在渲染一张页面的时候,一般须要从多个数据源拉取数据,并最终渲染至客户端。Node.js在这种场景中能够很天然很方便的同时并行发起对多个数据源的请求。

api.getUser("username", function (profile) {
    // Got the profile
});
api.getTimeline("username", function (timeline) {
    // Got the timeline
});
api.getSkin("username", function (skin) {
    // Got the skin
});

Node.js经过异步机制使请求之间无阻塞,达到并行请求的目的,有效的调用下层资源。可是,这个场景中的问题是对于多个事件响应结果的协调并不是被Node.js原生优雅地支持。为了达到三个请求都获得结果后才进行下一个步骤,程序也许会被变成如下状况:

api.getUser("username", function (profile) {
    api.getTimeline("username", function (timeline) {
        api.getSkin("username", function (skin) {
            // TODO
        });
    });
});

这将致使请求变为串行进行,没法最大化利用底层的API服务器。

为解决这类问题,我曾写做一个模块(EventProxy,https://github.com/JacksonTian/eventproxy)来实现多事件协做,如下为上面代码的改进版:

var proxy = new EventProxy();
proxy.all("profile", "timeline", "skin", function (profile, timeline, skin) {
    // TODO
});
api.getUser("username", function (profile) {
    proxy.emit("profile", profile);
});
api.getTimeline("username", function (timeline) {
    proxy.emit("timeline", timeline);
});
api.getSkin("username", function (skin) {
    proxy.emit("skin", skin);
});

EventProxy也是一个简单的事件侦听者模式的实现,因为底层实现跟Node.js的EventEmitter不一样,没法合并进Node.js中。可是却提供了比EventEmitter更强大的功能,且API保持与EventEmitter一致,与Node.js的思路保持契合,并能够适用在前端中。

这里的all方法是指侦听完profile、timeline、skin三个方法后,执行回调函数,并将侦听接收到的数据传入。

最后还介绍一种解决多事件协做的方案:Jscex(https://github.com/JeffreyZhao/jscex )。Jscex经过运行时编译的思路(须要时也可在运行前编译),将同步思惟的代码转换为最终异步的代码来执行,能够在编写代码的时候经过同步思惟来写,能够享受到同步思惟的便利写做,异步执行的高效性能。若是经过Jscex编写,将会是如下形式:

var data = $await(Task.whenAll({
    profile: api.getUser("username"),
    timeline: api.getTimeline("username"),
    skin: api.getSkin("username")
}));
// 使用data.profile, data.timeline, data.skin
// TODO

此节感谢Jscex做者@老赵(http://blog.zhaojie.me/)的指正和帮助。

利用事件队列解决雪崩问题

所谓雪崩问题,是在缓存失效的情景下,大并发高访问量同时涌入数据库中查询,数据库没法同时承受如此大的查询请求,进而往前影响到网站总体响应缓慢。那么在Node.js中如何应付这种情景呢。

var select = function (callback) {
        db.select("SQL", function (results) {
            callback(results);
        });
    };

以上是一句数据库查询的调用,若是站点恰好启动,这时候缓存中是不存在数据的,而若是访问量巨大,同一句SQL会被发送到数据库中反复查询,影响到服务的总体性能。一个改进是添加一个状态锁。

var status = "ready";
var select = function (callback) {
        if (status === "ready") {
            status = "pending";
            db.select("SQL", function (results) {
                callback(results);
                status = "ready";
            });
        }
    };

可是这种情景,连续的屡次调用select发,只有第一次调用是生效的,后续的select是没有数据服务的。因此这个时候引入事件队列吧:

var proxy = new EventProxy();
var status = "ready";
var select = function (callback) {
        proxy.once("selected", callback);
        if (status === "ready") {
            status = "pending";
            db.select("SQL", function (results) {
                proxy.emit("selected", results);
                status = "ready";
            });
        }
    };

这里利用了EventProxy对象的once方法,将全部请求的回调都压入事件队列中,并利用其执行一次就会将监视器移除的特色,保证每个回调只会被执行一次。对于相同的SQL语句,保证在同一个查询开始到结束的时间中永远只有一次,在这查询期间到来的调用,只需在队列中等待数据就绪便可,节省了重复的数据库调用开销。因为Node.js单线程执行的缘由,此处无需担忧状态问题。这种方式其实也能够应用到其余远程调用的场景中,即便外部没有缓存策略,也能有效节省重复开销。此处也能够用EventEmitter替代EventProxy,不过可能存在侦听器过多,引起警告,须要调用setMaxListeners(0)移除掉警告,或者设更大的警告阀值。

相关文章
相关标签/搜索