你们好,分享即关爱,咱们很乐意和你分享一些新的知识,咱们准备了一个 Nginx 的教程,分为三个系列,若是你对 Nginx 有所耳闻,或者想增进 Nginx 方面的经验和理解,那么恭喜你来对地方了。javascript
咱们会告诉你 Nginx 如何工做及其背后的理念,还有如何优化以加快应用的性能,如何安装启动和保持运行。css
这个教程有三个部分:java
建立这个系列,咱们但愿,一是做为参考书,能够经过快速查找到相关问题(好比 gzip 压缩,SSL 等)的解决方式,也能够直接通读全文。为了得到更好的学习效果,咱们建议你在本机安装 Nginx 而且尝试进行实践。node
tcp_nodelay, tcp_nopush 和 sendfile
tcp_nodelay 复制代码
在 TCP 发展早期,工程师须要面对流量冲突和堵塞的问题,其中涌现了大批的解决方案,其中之一是由 John Nagle 提出的算法。nginx
Nagle 的算法旨在防止通信被大量的小包淹没。该理论不涉及全尺寸 tcp 包(最大报文长度,简称 MSS)的处理。只针对比 MSS 小的包,只有当接收方成功地将之前的包(ACK)的全部确认发送回来时,这些包才会被发送。在等待期间,发送方能够缓冲更多的数据以后再发送。算法
if package.size >= MSS.size
send(package)
elsif acks.all_received?
send(package)
else
# acumulate data
end 复制代码
与此同时,诞生了另外一个理论,延时 ACKsql
在 TCP 通信中,在发送数据后,须要接收回应包(ACK)来确认数据被成功传达。json
延时 ACK 旨在解决线路被大量的 ACK 包拥堵的情况。为了减小 ACK 包的数量,接收者等待须要回传的数据加上 ACK 包回传给发送方,若是没有数据须要回传,必须在至少每 2 个 MSS,或每 200 至 500 毫秒内发送 ACK(以防咱们再也不收到包)。后端
if packages.any?
send
elsif last_ack_send_more_than_2MSS_ago? || 200_ms_timer.finished?
send
else
# wait
end 复制代码
正如你可能在一开始就注意到的那样 —— 这可能会致使在持久链接上的一些暂时的死锁。让咱们重现它!浏览器
假设:
场景:
因为是初始的拥塞窗口,发送端被容许传送两个包:A 和 B
在这个数据交换过程当中,因为 Nagel 和延迟 ACK 之间的死锁,引入了 200ms 的延迟。
Nagle 算法是当时真正的救世主,并且目前仍然具备极大的价值。但在大多数状况下,咱们不会在咱们的网站上使用它,所以能够经过添加 TCP_NODELAY 标志来安全地关闭它。
tcp_nodelay on; # sets TCP_NODELAY flag, used on keep-alive connections 复制代码
享受这200ms提速吧!
sendfile
正常来讲,当要发送一个文件时须要下面的步骤:
这涉及到两个上下文切换(读,写),并使相同对象的第二个副本成为没必要要的。正如你所看到的,这不是最佳的方式。值得庆幸的是还有另外一个系统调用,提高了发送文件(的效率),它被称为:sendfile(2)(想不到吧!竟然是这名字)。这个调用在文件 cache 中检索一个对象,并传递指针(不须要复制整个对象),直接传递到 socket 描述符,Netflix 表示,使用 sendfile(2) 将网络吞吐量从 6Gbps 提升到了 30Gbps。
然而,sendfile(2) 有一些注意事项:
在 nginx 中打开它
sendfile on; 复制代码
tcp_nopush
tcp_nopush 与 tcp_nodelay 相反。不是为了尽量快地推送数据包,它的目标是一次性优化数据的发送量。
在发送给客户端以前,它将强制等待包达到最大长度(MSS)。并且这个指令只有在 sendfile 开启时才起做用。
sendfile on;
tcp_nopush on; 复制代码
看起来 tcp_nopush 和 tcp_nodelay 是互斥的。可是,若是全部 3 个指令都开启了,nginx 会:
工做进程
worker_process 指令会指定:应该运行多少个 worker。默认状况下,此值设置为 1。最安全的设置是经过传递 auto 选项来使用核心数量。
但因为 Nginx 的架构,其处理请求的速度很是快 – 咱们可能一次不会使用超过 2-4 个进程(除非你正在托管 Facebook 或在 nginx 内部执行一些 CPU 密集型的任务)。
worker_process auto; 复制代码
worker 链接
与 worker_process 直接绑定的指令是 worker_connections。它指定一个工做进程能够一次打开多少个链接。这个数目包括全部链接(例如与代理服务器的链接),而不只仅是与客户端的链接。此外,值得记住的是,一个客户端能够打开多个链接,同时获取其余资源。
worker_connections 1024; 复制代码
打开文件数目限制
在基于 Unix 系统中的“一切都是文件”。这意味着文档、目录、管道甚至套接字都是文件。系统对一个进程能够打开多少文件有一个限制。要查看该限制:
ulimit -Sn # soft limit
ulimit -Hn # hard limit 复制代码
这个系统限制必须根据 worker_connections 进行调整。任何传入的链接都会打开至少一个文件(一般是两个链接套接字以及后端链接套接字或磁盘上的静态文件)。因此这个值等于 worker_connections*2 是安全的。幸运的是,Nginx 提供了一个配置选项来增长这个系统的值。要使用这个配置,请添加具备适当数目的 worker_rlimit_nofile 指令并从新加载 nginx。
worker_rlimit_nofile 2048; 复制代码
配置
worker_process auto;
worker_rlimit_nofile 2048; # Changes the limit on the maximum number of open files (RLIMIT_NOFILE) for worker processes.
worker_connections 1024; # Sets the maximum number of simultaneous connections that can be opened by a worker process. 复制代码
最大链接数
如上所述,咱们能够计算一次能够处理多少个并发链接:
最大链接数 = worker_processes * worker_connections ---------------------------------------------- (keep_alive_timeout + avg_response_time) * 2 复制代码
keep_alive_timeout (后续有更多介绍) + avg_response_time 告诉咱们:单个链接持续了多久。咱们也除以 2,一般状况下,你将有一个客户端打开 2 个链接的状况:一个在 nginx 和客户端之间,另外一个在 nginx 和上游服务器之间。
Gzip
启用 gzip 能够显著下降响应的(报文)大小,所以,客户端(网页)会显得更快些。
压缩级别
Gzip 有不一样的压缩级别,1 到 9 级。递增这个级别将会减小文件的大小,但也会增长资源消耗。做为标准咱们将这个数字(级别)保持在 3 – 5 级,就像上面说的那样,它将会获得较小的节省,同时也会获得更大的 CPU 使用率。
这有个经过 gzip 的不一样的压缩级别压缩文件的例子,0 表明未压缩文件。
curl -I -H 'Accept-Encoding: gzip,deflate' https://netguru.co/ 复制代码
❯ du -sh ./*
64K ./0_gzip
16K ./1_gzip
12K ./2_gzip
12K ./3_gzip
12K ./4_gzip
12K ./5_gzip
12K ./6_gzip
12K ./7_gzip
12K ./8_gzip
12K ./9_gzip 复制代码
❯ ls -al
-rw-r--r-- 1 matDobek staff 61711 3 Nov 08:46 0_gzip -rw-r--r-- 1 matDobek staff 12331 3 Nov 08:48 1_gzip -rw-r--r-- 1 matDobek staff 12123 3 Nov 08:48 2_gzip -rw-r--r-- 1 matDobek staff 12003 3 Nov 08:48 3_gzip -rw-r--r-- 1 matDobek staff 11264 3 Nov 08:49 4_gzip -rw-r--r-- 1 matDobek staff 11111 3 Nov 08:50 5_gzip -rw-r--r-- 1 matDobek staff 11097 3 Nov 08:50 6_gzip -rw-r--r-- 1 matDobek staff 11080 3 Nov 08:50 7_gzip -rw-r--r-- 1 matDobek staff 11071 3 Nov 08:51 8_gzip -rw-r--r-- 1 matDobek staff 11005 3 Nov 08:51 9_gzip 复制代码
gzip_http_version 1.1;
这条指令告诉 nginx 仅在 HTTP 1.1 以上的版本才能使用 gzip。咱们在这里不涉及 HTTP 1.0,至于 HTTP 1.0 版本,它是不可能既使用 keep-alive 和 gzip 的。所以你必须作出决定:使用 HTTP 1.0 的客户端要么错过 gzip,要么错过 keep-alive。
配置
gzip on; # enable gzip
gzip_http_version 1.1; # turn on gzip for http 1.1 and above
gzip_disable "msie6"; # IE 6 had issues with gzip
gzip_comp_level 5; # inc compresion level, and CPU usage
gzip_min_length 100; # minimal weight to gzip file
gzip_proxied any; # enable gzip for proxied requests (e.g. CDN)
gzip_buffers 16 8k; # compression buffers (if we exceed this value, disk will be used instead of RAM)
gzip_vary on; # add header Vary Accept-Encoding (more on that in Caching section)
# define files which should be compressed
gzip_types text/plain;
gzip_types text/css;
gzip_types application/javascript;
gzip_types application/json;
gzip_types application/vnd.ms-fontobject;
gzip_types application/x-font-ttf;
gzip_types font/opentype;
gzip_types image/svg+xml;
gzip_types image/x-icon; 复制代码
缓存
缓存是另外一回事,它能提高用户的请求速度。
管理缓存能够仅由 2 个 header 控制:
缓存自己能够分为两类:公共缓存和私有缓存。公共缓存是被多个用户共同使用的。专用缓存专用于单个用户。咱们能够很容易地区分,应该使用哪一种缓存:
add_header Cache-Control public;
add_header Pragma public; 复制代码
对于标准资源,咱们想保存1个月:
location ~* .(jpg|jpeg|png|gif|ico|css|js)$ {
expires 1M;
add_header Cache-Control public;
add_header Pragma public;
} 复制代码
上面的配置彷佛足够了。然而,使用公共缓存时有一个注意事项。
让咱们看看若是将咱们的资源存储在公共缓存(如 CDN)中,URI 将是惟一的标识符。在这种状况下,咱们认为 gzip 是开启的。
有2个浏览器:
旧的浏览器给 CDN 发送了一个 netguru.co/style 请求。可是 CDN 也没有这个资源,它将会给咱们的服务器发送请求,而且返回未经压缩的响应。CDN 在哈希里存储文件(为之后使用):
{
...
netguru.co/styles.css => FILE("/sites/netguru/style.css")
...
} 复制代码
而后将其返回给客户端。
如今,新的浏览器发送相同的请求到 CDN,请求 netguru.co/style.css,获取 gzip 打包的资源。因为 CDN 仅经过 URI 标识资源,它将为新浏览器返回同样的未压缩资源。新的浏览器将尝试提取未打包的文件,可是将得到无用的东西。
若是咱们可以告诉公共缓存是怎样进行 URI 和编码的资源识别,咱们就能够避免这个问题。
{
...
(netguru.co/styles.css, gzip) => FILE("/sites/netguru/style.css.gzip")
(netguru.co/styles.css, text/css) => FILE("/sites/netguru/style.css")
...
} 复制代码
这正是 Vary Accept-Encoding: 完成的。它告诉公共缓存,能够经过 URI 和 Accept-Encoding header 区分资源。
因此咱们的最终配置以下:
location ~* .(jpg|jpeg|png|gif|ico|css|js)$ {
expires 1M;
add_header Cache-Control public;
add_header Pragma public;
add_header Vary Accept-Encoding;
} 复制代码
超时
client_body_timeout 和 client_header_timeout 定义了 nginx 在抛出 408(请求超时)错误以前应该等待客户端传输主体或头信息的时间。
send_timeout 设置向客户端发送响应的超时时间。超时仅在两次连续的写入操做之间被设置,而不是用于整个响应的传输过程。若是客户端在给定时间内没有收到任何内容,则链接将被关闭。
设置这些值时要当心,由于等待时间过长会使你容易受到攻击者的攻击,而且等待时间过短的话会切断与速度较慢的客户端的链接。
# Configure timeouts
client_body_timeout 12;
client_header_timeout 12;
send_timeout 10; 复制代码
Buffers
client_body_buffer_size
设置读取客户端请求正文的缓冲区大小。若是请求主体大于缓冲区,则整个主体或仅其部分被写入临时文件。对 client_body_buffer_size 而言,设置 16k 大小在大多数状况下是足够的。
这是又一个能够产生巨大影响的设置,必须谨慎使用。过小了,则 nginx 会不断地使用 I/O 把剩余的部分写入文件。太大了,则当攻击者能够打开全部链接但你没法在系统上分配足够缓冲来处理这些链接时,你可能容易受到 DOS 攻击。
client_header_buffer_size 和 large_client_header_buffers
若是 header 不能跟 client_header_buffer_size 匹配上,就会使用 large_client_header_buffers。若是请求也不适合 large_client_header_buffers,将给客户端返回一个错误提示。对于大多数的请求来讲,1KB 的缓存是足够的。可是,若是一个包含大量记录的请求,1KB 是不够的。
若是请求行的长度超限,将给客户端返回一个 414(请求的 URI 太长)错误提示。若是请求的 header 长度超限,将抛出一个 400(错误请求)的错误代码
client_max_body_size
设置客户端请求主体的最大容许范围,在请求头字段中指定“内容长度”。若是您但愿容许用户上传文件,调整此配置以知足您的须要。
推荐一个交流学习群:478030634 里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化这些成为架构师必备的知识体系。还能领取免费的学习资源,目前受益良多:
配置
client_body_buffer_size 16K;
client_header_buffer_size 1k;
large_client_header_buffers 2 1k;
client_max_body_size 8m; 复制代码
Keep-Alive
HTTP 所依赖的 TCP 协议须要执行三次握手来启动链接。这意味着在服务器可发送数据(例如图像)以前,须要在客户机和服务器之间进行三次完整的往返。
假设你从 Warsaw 请求的 /image.jpg,并链接到在柏林最近的服务器:
Open connection
TCP Handshake:
Warsaw ->------------------ synchronize packet(SYN) ----------------->- Berlin
Warsaw -<--------- synchronise-acknowledgement packet(SYN-ACK) ------<- Berlin
Warsaw ->------------------- acknowledgement(ACK) ------------------->- Berlin
Data transfer:
Warsaw ->---------------------- /image.jpg --------------------------->- Berlin
Warsaw -<--------------------- (image data) --------------------------<- Berlin
Close connection 复制代码
对于另外一次请求,你将不得再也不次执行整个初始化。若是你在短期内发送屡次请求,这可能会快速累积起来。这样的话 keep-alive 使用起来就方便了。在成功响应以后,它保持链接空闲给定的时间段(例如 10 秒)。若是在这段时间内有另外一个请求,现有的链接将被重用,空闲时间将被刷新。
Nginx 提供了几个指令来调整 keepalive 设置。这些能够分为两类:
在客户端和 nginx 之间 keep-alive
keepalive_disable msie6; # disable selected browsers.
# The number of requests a client can make over a single keepalive connection. The default is 100, but a much higher value can be especially useful for testing with a load‑generation tool, which generally sends a large number of requests from a single client.
keepalive_requests 100000;
# How long an idle keepalive connection remains open.
keepalive_timeout 60; 复制代码
在 nginx 和上游服务器之间 keep-alive
upstream backend {
# The number of idle keepalive connections to an upstream server that remain open for each worker process
keepalive 16;
}
server {
location /http/ {
proxy_pass http://http_backend;
proxy_http_version 1.1;
proxy_set_header Connection "";
}
} 复制代码