实例说明为何应使用 Node.js

请输入图片描述

JavaScript 高涨的人气带来了不少变化,以致于现在使用其进行网络开发的形式也变得大相径庭了。就如同在浏览器中同样,如今咱们也能够在服务器上运行 JavaScript ,从前端跨越到后端,这样巨大的反差让人不可思议,由于仅仅在几年前 Javascript 还如同 Flash 或者 Java applet 那样嵌入网页在沙箱环境中运行。javascript

在深刻Node.js以前,你可能须要阅读和了解使用跨栈式 JavaScript(JavaScript across the stack)带来的好处,它统一了编程语言和数据格式(JSON),让你能最佳地重用开发人员资源。因为这更多的是关于 JavaScript 的特色,这里就不过多讨论它。但它确实是一个让人在开发环节中使用 Node 的关键的优势。html

正如 维基百科 所说:“Node.js 是谷歌 V8 引擎、libuv平台抽象层 以及主体使用 Javscript 编写的核心库三者集合的一个包装外壳。” 除此以外,值得注意的是,Node.js 的做者瑞恩·达尔 (Ryan Dahl) 的目标是建立具备实时推送能力的网站。在 Node.js 中,他给了开发者一个使用事件驱动来实现异步开发的优秀解决方案。(注:V8是谷歌开发的,目前公认最快的 Javascript 解析引擎,libuv 是一个开源的、为 Node 定制而生的跨平台的异步 IO 库。)前端

简而言之:Node.js 在实时的 Web应用上采用了基于 WebSocket 的推送技术。这意味着什么样的革命性?Well,在通过了20多年的基于无状态的请求-返机制的无状态交互以后,咱们终于有了实时的,双向链接的web应用,客户端和服务器端均可以发起通讯,可以自由地交换数据。与此造成鲜明对比的是传统的 web响应模式,客户端老是主动发起通讯而服务端被动返回。此外,这些都是基于运行在标准80端口上的开放Web组件(HTML、CSS和JS)。java

可能有人会说,咱们已经使用 Flash 和 Java Applet 的形式不少年了——但实际上,这些方式只是使用网络将数据传递到客户端上的沙箱环境。他们都是隔离运行的,并且常常操做到须要额外的权限之类的非标准端口。node

凭借其独特的优点,Node.js的如今已经在许多著名公司的产品中起到了关键做用。nginx

在这篇文章中,咱们不只将讨论这些优点是如何实现的,并且也会讨论为何你使用 Node.js 来替代一些经典的Web应用程序模型。git

Node.js 是如何工做的?

Node.js 的主要思路是:使用非阻塞的,事件驱动的 I/O 操做来保持在处理跨平台 (across distributed devices) 数据密集型实时应用时的轻巧高效。这听起来有点绕口。程序员

它的真正含义是,Node.js 不是一个即将主导Web开发的世界的银弹级的平台。相反,它是一个知足特别需求的平台。你确定不会但愿使用 Node.js 去作 CPU密集型操做。事实上,使用它进行繁重的计算等于摒弃 Node 几乎全部的优势。Node 真正的亮点在于建设高性能,高扩展性的互联网应用——由于它可以处理庞大的而且高吞吐量的并发链接。github

它的工做原理是至关有趣的。传统的网络服务技术,是每一个新增一个链接(请求)便生成一个新的线程,这个新的线程会占用系统内存,最终会占掉全部的可用内存。而 Node.js 仅仅只运行在一个单线程中,使用非阻塞的异步 I/O 调用,全部链接都由该线程处理,在 libuv 的加分下,能够容许其支持数万并发链接(所有挂在该线程的事件循环中)。web

toptal-blog-1_B

作一个简单的计算: 假设是普通的Web程序,新接入一个链接会占用 2M 的内存,在有 8GB RAM的系统上运行时, 算上线程之间上下文切换的成本,并发链接的最大理论值则为 4000 个。这是在传统 Web服务端技术下的处理状况。而 Node.js 则达到了约 1M 一个并发链接的拓展级别 (相关证实).

固然,在全部客户端的请求共享单一线程时也会有问题, 这也是一个编写 Node.js 应用的潜在缺陷. 首先, 大量的计算可能会使得 Node 的单线程暂时失去反应, 并致使全部的其余客户端的请求一直阻塞, 直到计算结束才恢复正常。 其次,开发人员须要很是当心,不要让一个 Exception 阻塞核心的事件循环,由于这将致使 Node.js 实例的终止(实际上就是程序崩溃)。( 笔者注:如 PHP 中某个页面挂掉是不会影响网站运行的,可是 Nodejs 是一个线程一个线程来处理全部的连接,因此不管是计算卡了或者是被异常阻塞了均可能会影响到其余全部的连接。解决方案在稍后讨论。)

用来避免异常抛出时中断进程的方法是将异常使用回调传递出去(而不是抛出他们,就像在其余环境中同样)。即便一些未处理的异常阻塞了程序,依旧有多种应对的解决方案,并且也有不少可用于监视 Node 进程来执行必要的崩溃后恢复工做的策略和工具(虽然你将没法恢复用户的 Session ),最多见的是使用 Forever 模块,或者采用其余的外部系统工具如 upstart and monit

NPM: The Node Package Manager

当咱们讨论 Node.js 的时候,一个绝对不该该忽略地方就是默认内置的模块管理工具 —— NPM。 其灵感来源与 Ruby Gems(具备版本和依赖管理功能,能够经过在线资料库便捷安装可重用的组件的管理工具)。

一个完整的公用模块列表能够在 NPM 的网站上找到,或者经过使用与 Node.js 一同安装的 NPM CLI 工具放问到。该模块的生态系统向全部人开放,任何人均可以发布本身的模块,全部的模块均可以在 NPM 资料库中找到。你能够在 页面找到 NPM 的一个简要介绍(有点旧,但依旧能看)。

目前很是流行的一些 NPM 模块有:

  • express – Express.js,是一个简洁而灵活的 node.js Web应用框架, 而且已是如今大多数 Node.js 应用的标准框架,你已经能够在不少 Node.js 的书籍中看到它了。
  • connect – Connect 是一个 Node.js 的 HTTP 服务拓展框架,提供一个高性能的“插件”集合,以中间件闻名,是 Express 的基础部分之一。
  • socket.iosockjs – 目前服务端最流行的两个 websocket 组件。
  • Jade – 流行的模板引擎之一,而且是 Express.js 的默认模板引擎。其灵感来源于 HAML。
  • mongomongojs – 封装了 MongoDB 的的各类 API,不过笔者日常工做用的是 mongoose 也很推荐。
  • redis – Redis 的客户端函数库.
  • coffee-script – CoffeeScript 编译器,容许开发者使用 Coffee 来编写他们的 Node.js 程序。
  • underscore (lodash, lazy) – 最流行的 JavaScript 工具库 , 用于 Node.js 的封装包,以及两个采起略有不一样的实现方法来得到更好性能的副本(counterparts)。
  • forever – 多是用来确保 node 脚本持续运行的最流行的工具。

还有不少好的模块,这里就不一一列举了(但愿没有冒犯到没列举的)。

Node.js 应该用在什么地方

聊天

聊天是最典型的多用户实时交互的应用。从 IRC 开始,有许多开源或者不开源的协议都运行在非标准端口上,而如今,使用 Node.js 则能够解决这些问题——在标准的80端口运行 WebSockets。

聊天应用程序是最能体现 Node.js 优势的例子:轻量级、高流量而且能良好的应对跨平台设备上运行密集型数据(虽然计算能力低)。同时,聊天也是一个很是值得学习的用例,由于它很简单,而且涵盖了目前为止一个典型的 Node.js 会用到的大部分解决方案。

让咱们试着来描绘它如何工做。

在最简单的状况下,咱们布置了一个聊天室在咱们的网站上,用户能够在上面发消息,固然是一对多的形式。例如,假设总共有三我的链接到咱们的网站上。

在服务端这边, 咱们有一个使用 Express.js 搭建的简单站点,该站点实现了两件事 1) 处理路径为 ‘/’ 的GET请求时,下发包括一个留言板以及一个发送信息的 ‘发送’ 按钮的页面 2) 一个监听客户端发送新消息的 websockets 服务。

在客户端这边,咱们有一个 HTML 页面,上面有个两个 js 方法,一个是用于触发事件的 “发送” 按钮,这会把把输入的消息经过 webscoket 发送,另外一个方法是用 webscoket 在客户端上监听服务端来的推送(例如,其余用户发送的消息)。

当有一个客户端发送消息的时候,发生的事情是:

  1. 浏览器上,点击发送按钮触发了 js 函数,将输入框中的文字经过 websocket 消息发送到服务器的 websocket 客户端(页面初始化加载的时候链接的)。
  2. 服务端的 websocket 组件收到 消息,而后经过广播方法转发到其余全部链接的客户端。
  3. 经过页面上运行的 websocket 客户端组件,全部的客户端都能收到这条推送的新消息。接着 js 处理函数能够把这个消息添加到文字框内。

toptal-blog-2_B

这是一个最简单的例子。若是要更好的解决方案,你可使用 Redis 数据库作一个简单的缓存。在一个更高级的解决方案中,你可能须要一个消息路由来专门处理消息队列,而且须要一个更强健的发送机制,好比发送的时候覆盖上暂时离线的用户或者为离线的注册用户存储还没有接收的消息等等。可是不论你作了怎么样的改进,Node.js 都将遵循一个基本原则:响应事件,处理多个并发链接,并保持流动性的用户体验。

对象数据库接口(API ON TOP OF AN OBJECT DB)

尽管,Node.js 确实很是擅长实时交互的应用,同时它也十分适合经过对象数据库(object DB)来查询数据(如 MongoDB)。以 JSON 格式存储的数据容许 Node.js 直接处理,不须要纠结数据转换和匹配的问题。

举个例子,若是你正在使用 Rails,你会将 JSON 数据转成 二进制的 model,当数据再被 Backbone.js, Angular.js 或者 jQuery AJAX 之类的调用又要转回 JSON。若是是 Nodejs 的话,你能够经过一个 REST API 简单的导出 JSON 对象以供客户端使用。另外,从数据库读写时候若是使用的是 MongoDB 的话,你也不用担忧的 JSON 与任何数据之间的格式问题。总之,你能够避免多元的数据转换问题,不管是在客户端、服务端仍是数据库。

队列输入

若是你正在接收一个高量并发的数据,你的数据库可能会成为你处理的瓶颈。正如上面的描述,Node.js 能够轻松的处理并发链接。 可是,因为数据库操做是一个阻塞的操做(在这种状况下),这就是麻烦的地方。Node.js的解决方案是,在数据真正的写入以前就认可客户端的数据是真实的。

用这种方法,在高负载的时候系统继续维持它的响应,这在当客户端不须要严格确认一个数据是否成功的被写入时特别有用。典型的例子包括:日志记录或者用户跟踪数据(user-tracking data)的记录,这会被分批处理而且在稍后才使用;同时也包括最终一致性(so, 经常使用于 NoSQL)能够接受,不须要当即反应的操做(例如 Facebook 上更新点赞的数目)。

数据经过某些缓存或者消息队列的基础组件(例如 RabbitMQ, ZeroMQ)进入队列,而且经过一个独立的数据库批量写入进程来一一消化,或者经过一个更高性能的计算密集型后端服务来进行处理。其余的语言/框架也能够实现类似的操做,但在相同的配置下是达不到 nodejs 的高吞吐量与高并发。

toptal-blog-3_B

简单的说:使用 Node,你能够把数据库操做扔到一边并在稍后处理它们,假设他们成功了同样继续执行下去。(笔者注:在开发中一般的状况一般是,种耗时的操做经过回调函数来异步处理,主线程继续往下执行)

数据流

在较为传统的网络平台上,HTTP 的请求和响应更像是孤立的事件;然而事实上,他们都是数据流。这一观察结果在 Nodejs 上能够用来创建一些很酷的功能。由于数据通以流的形式接收,而咱们能够在网站上在线处理正在上传中的文件。这样的话,就能够实现实时的音频和视频编码,以及在不一样数据源之间进行代码(代理见下一段)。

(笔者注:Node 有代替如 apache 这样的 webserver 处理数据,因此开发者能够直接收到客户端一份一份上传的数据,并实时处理。上面这段话听起来有点抽象,不过各位能够简单的想象一下不须要开 YY 或者 QQ,打开网页就能进行语音视频的功能。)

代理

Node.js 能够经过异步的方式处理大量的并发链接,因此很容易做为服务端的代理来使用。这在与不一样响应时间的不一样服务之间进行代理,或者是收集来自多个来源的数据时尤为有用。

举个例子:考虑一个服务器端的应用程序和第三方资源进行通讯以更新自不一样来源的数据,或者将服务端上的一些图像和视频资源存储到第三方云服务。

虽然专用代理服务器确实存在,可是若是你尚未专用的代理服务器,或者你须要一个本地开发的解决方案,那么使用 Node 来作代理多是更好的选择。关于这个解决方案,个人意思是指当你在开发的时候,你可使用Node.js的开发环境搭建一个服务来处理对资源和代理的请求,而在生产环境下,你可使用专用的代理服务(好比nginx,HAProxy等)来处理这些交互。

股票操盘手的仪表盘

让咱们继续讨论应用程序这块。实时网络的解决方案能够很轻松的实现证券交易软件——用于跟踪股票的价格,执行计算、作技术分析,同时生成报表。

使用一个实时的的基于网页的解决方案,将会容许操盘手轻松的切换工做软件以及工做地点。相信不久,咱们或许会在 佛罗里达州、伊维萨岛又或者是巴厘岛的海滩上看到他们。

应用监听仪盘表

另外一种常见的用例中,使用 Node+Web+Socket 很是适合:跟踪网站访问者而且可视化实时它们之间的实时交互。 (若是你有兴趣,能够去看看 Hummingbird

你可能须要采集用户的实时状态, 或者甚至当他们到达渠道中某个特定的点时, 打开一个交流频道, 经过有针对性的互动介绍移动到下一个阶段. (若是你感兴趣的话,推荐你看看 CANDDi

想象一下,若是你知道你的访客的实时操做,并可以形象化地看到他们的交互,这将对你的业务带来多大的提高。随着实时的、双向 socket 通讯的 Node.js ,如今你能够作到了。

系统监控仪表

如今,让咱们看看事情的基础设施方面。想象一下,好比,但愿为其用户提供服务监控页面(例如,GitHub上的状态页)的 SaaS 运营商 。经过 Node.js 的事件循环,咱们能够建立一个基于 Web 的功能强大的仪表板,以异步方式检查服务状态而且使用的 WebSockets 将数据推送到客户端。

内部(公司内部)和公共服务的状态均可以使用该项技术实现实时的上报。让咱们把这一想法延伸的远一点,试着想象一个电信运营商中网络运营中心(NOC)的监控应用,云/网络/服务器运营商,或者一些金融机构,全都运行在这个由 Node.js 和 WebSocket 组成的应用上,而不是 Java 和/或 Java Applet。

注意:不要尝试使用 Node 打造硬实时系统(即,响应时间要求一致的系统)。 Erlang是多是该类应用程序的更好的选择

什么地方可使用 Node.js

服务端 WEB 应用

经过 Node.js 使用 Express.js 也能够用来建立服务端上的典型的网页应用。然而,虽然有可能,使用 Node.js 来进行请求+响应的形式来呈现 HTML 并非最典型的用例。有人同意也有人反对这一作法。这里有一些见解以供参考:

优势:

  • 若是你不须要进行 CPU密集型计算,你能够从头至尾甚至是数据库(好比 MongoDB)都使用 Javascript 来开发。这显著地减轻了开发工序(包括成本)。
  • 对于一个使用 Node.js 做为服务端的单页应用或者 websocket 应用,爬虫能够收到一个彻底 HTML 呈现的响应,这是更为SEO友好的。

缺点:

  • 任何CPU密集型的计算都将阻碍 Node.js 的反应,因此使用多线程的平台是一个更好的方法。或者,您也能够尝试向外扩展的计算1
  • Node.js 使用关系型数据库依旧十分痛苦(详细见下方)。拜托了,若是你想执行关系型数据操做,请考虑别的环境:Rails, Django 甚至 ASP.NET MVC ...

  • 1另外一种解决方案是,为这些CPU密集型的计算创建一个高度可扩展的MQ支持的环境与后端处理,以保持 Node 做为一个前台专员来异步处理客户端请求。*

Node.js 不该该在什么地方使用

使用关系型数据库的服务端 WEB 应用

对比 Node.js 上的 Express.js 和 Ruby on Rails,当你使用关系型数据库的时候请绝不犹豫的选择后者。

Node.js 的关系数据库工具仍处于早期阶段,目前尚未成熟到让人可以愉快地使用它。而与此同时,Rails天生自带了数据访问组件,连同DB schema迁移的支持工具和一些Gems(一语双关,一指这些如同珍宝的工具,二指ruby的gems程序包)。Rails和它的搭档框架们拥有很是成熟且被证实了的活动记录(Active Record)或数据映射(Data Mapper)的数据访问层的实现,而这些是当你在使用纯JavaScript来复制这些应用的时候会很是想要使用的东西。

不过,若是你真的倾向于所有使用 JS(而且作好可能抓狂的准备),那么请继续关注 Sequelize 和 Node ORM2 ,虽然这二者仍然不成熟的,但他们最终会迎头遇上。

注:使用 Node 光是做为前端而 Rails 作后端来链接关系型数据库,这是彻底有可能也并很多见的。(笔者注:国外有种说法,PHP这一类程序员也能够算做是前端)

繁重的服务端的计算和处理

当涉及到大量的计算,Node.js 就不是最佳的解决方案。你确定不但愿使用 Node.js 创建一个斐波那契数的计算服务。通常状况下,任何 CPU密集型操做 会削弱掉 Node经过事件驱动, 异步 I/O 模型等等带来的在吞吐量上的优点,由于当线程被非异步的高计算量占用时任何传入的请求将被阻塞。

正如前面所说,Node.js 是单线程的,只使用一个单一的CPU核心。至于,涉及到服务器上多核并发处理,Node 的核心团队已经使用 cluster 模块的形式在这一方面作了一些工做 (参考:http://nodejs.org/api/cluster.html )。固然,您也能够很容易的经过 nginx 的反向代理运行多个 Node.js 的服务器实例来避免单一线程阻塞的问题。

关于集群(clustering) ,你应该将全部繁重的计算转移到更合适的语言写的后台进程来处理,同时让他们经过像 RabbitMQ 那样经过消息队列服务器来进行通讯。

即便你的后台处理可能最初运行在同一台服务器上时看不出什么优势,可是这样的作法具备很是高的可扩展性的潜力。这些后台处理服务能够容易地分割出去,做为单独的 worker 服务器,而不须要配置入口 web服务器的负载。

固然,你也能够在其余语言平台上用一样的方法,但使用 Node.js 你能够获得很高的吞吐量,每一个请求都做为一个小任务很是迅速和高效地处理,这一点咱们已经讨论过了。

结论

咱们已经从理论到实践讨论过 Node.js 了,从它的目标和野心,到其优势和缺点。在 Node.js 的开发中99%的问题是由误用阻塞操做而形成的。

请记住:Node.js 历来不是用于解决大规模计算问题而建立的。它的出现是为了解决大规模I/O 的问题,而且在这一点上作的很是好

综上,若是你项目需求中不包含CPU密集型操做,也不须要访问任何阻塞的资源,那么你就能够利用的 Node.js 的优势,尽情的享受快速、可扩展的网络应用。


原文:Why The Hell Would I Use Node.js? A Case-by-Case Introduction
转载自:伯乐在线 - Lellansin

相关文章
相关标签/搜索