架构师细说 NGINX 的配置及优化

时间 2019-12-19

原文原文链接

最近感受不少东西在运用到必定的程度以后，会发现原来是本身了解到的不够。一方面限于实际运用到的很少，一方面多是由于一开始没有进行全面认识。遂这里搜集整理了一番NGINX。php

1、nginx启动和关闭

centos平台,源码安装的html

/usr/local/nginx/nginx # 启动前端

/usr/local/nginx/nginx -s reload # 平滑重启node

/usr/local/nginx/nginx.conf # 配置文件linux

mac平台，使用brew安装的nginx

/usr/local/bin/nginx # 启动web

/usr/local/bin/nginx -s reload # 平滑重启算法

/usr/local/etc/nginx/nginx.cnf # 配置文件apache

2、nginx.conf 配置文件详解

其实，对比，apache 的配置文件，它的相对比较清晰和简单，以前以为很难，如今沉下心来想一想，其实很简单。大体的分块下，基本就分为如下几块：小程序

main

events {

....

}

http {

....

upstream myproject {

.....

}

server {

....

location {

....

}

}

server {

....

location {

....

}

}

....

}

以上咱们能够看出，nginx配置文件主要分为六个区域：

一、main (全局设置)

二、events (nginx工做模式)

三、http (http设置)

四、sever (主机设置)

五、location (URL匹配)

六、upstream (负载均衡服务器设置)

2.1 main模块

下面是一个main区域，他是一个全局的设置

user nobody nobody; # 指定 Nginx Worker 进程运行用户以及用户组，默认由 nobody 帐号运行

worker_processes 2; # 指定 Nginx 要开启的子进程数

error_log /usr/local/var/log/nginx/error.log notice; # 定义全局错误日志文件

pid /usr/local/var/run/nginx/nginx.pid; # 指定进程 id 的存储文件位置

worker_rlimit_nofile 1024; # 指定一个 nginx 进程能够打开的最多文件描述符数目，若是设置 65535，须要使用命令 “ulimit -n 65535” 来设置

user 来指定 Nginx Worker 进程运行用户以及用户组，默认由 nobody 帐号运行。

worker_processes 来指定了 Nginx 要开启的子进程数。每一个 Nginx 进程平均耗费 10M~12M 内存。根据经验，通常指定 1 个进程就足够了，若是是多核 CPU，建议指定和 CPU 的数量同样的进程数便可。我这里写 2，那么就会开启 2 个子进程，总共 3 个进程。

error_log 用来定义全局错误日志文件。日志输出级别有 debug、info、notice、warn、error、crit 可供选择，其中，debug 输出日志最为最详细，而 crit 输出日志最少。

pid 用来指定进程id的存储文件位置。

worker_rlimit_nofile 用于指定一个 nginx 进程能够打开的最多文件描述符数目，这里是 65535，须要使用命令 “ulimit -n 65535” 来设置。

2.2 events 模块

events 模块来用指定 nginx 的工做模式和工做模式及链接数上限，通常是这样

events {

use kqueue; # mac 平台，指定 Nginx 的工做模式

worker_connections 1024; # 定义 Nginx 每一个进程的最大链接数，即接收前端的最大请求数，默认是 1024

}

use 用来指定 Nginx 的工做模式。Nginx 支持的工做模式有 select、poll、kqueue、epoll、rtsig 和 /dev/poll。其中 select 和 poll 都是标准的工做模式，kqueue 和 epoll 是高效的工做模式，不一样的是 epoll 用在 Linux 平台上，而 kqueue 用在 BSD 系统中，由于 Mac 基于 BSD ,因此 Mac 也得用这个模式，对于 Linux 系统，epoll 工做模式是首选。

worker_connections 用于定义Nginx每一个进程的最大链接数，即接收前端的最大请求数，默认是1024。最大客户端链接数由worker_processes 和 worker_connections 决定，即 Max_clients = worker_processes * worker_connections，在做为反向代理时，Max_clients 变为：Max_clients = worker_processes * worker_connections/4。

进程的最大链接数受 Linux 系统进程的最大打开文件数限制，在执行操做系统命令 “ulimit -n 65536” 后 worker_connections 的设置才能生效。

2.3 http 模块

http 模块能够说是最核心的模块了，它负责 HTTP 服务器相关属性的配置，它里面的 server 和 upstream 子模块，相当重要，等到反向代理和负载均衡以及虚拟目录等会仔细说。

http{

include mime.types; # 用来设定文件的 mime 类型，来告诉 nginx 来识别文件类型

default_type application/octet-stream; # 设定了默认的类型为二进制流，也就是当文件类型未定义时使用这种方式

log_format main '$remote_addr - $remote_user [$time_local] "$request" '

'$status $body_bytes_sent "$http_referer" '

'"$http_user_agent" "$http_x_forwarded_for"';

# log_format 设置日志的格式，和记录哪些参数，这里设置为 main 类型的日志

access_log /usr/local/var/log/nginx/access.log main;

# access_log 记录每次的访问日志的文件地址，后面的 main 是日志的格式样式，对应于 log_format 的 main

sendfile on; # 开启高效文件传输模式

tcp_nopush on; # 设置为 on 用于防止网络阻塞

tcp_nodelay on; # 设置为 on 用于防止网络阻塞

keepalive_timeout 10; # 设置客户端链接保持活动的超时时间。在超过这个时间以后，服务器会关闭该链接

#gzip on;

upstream myproject {

.....

}

server {

....

}

}

下面详细介绍下这段代码中每一个配置选项的含义。

include 用来设定文件的 mime 类型,类型在配置文件目录下的 mime.type 文件定义，来告诉 nginx 来识别文件类型。

default_type 设定了默认的类型为二进制流，也就是当文件类型未定义时使用这种方式，例如在没有配置 asp 的 locate 环境时，Nginx 是不予解析的，此时，用浏览器访问 asp 文件就会出现下载了。

log_format 用于设置日志的格式（格式设置可参照 Nginx日志格式设置），和记录哪些参数，这里设置为 main，恰好用于 access_log 来记录这种类型。

main 的类型日志以下：也能够增删部分参数。

127.0.0.1 - - [21/Apr/2015:18:09:54 +0800] "GET /index.php HTTP/1.1" 200 87151 "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.76 Safari/537.36"

access_log 用来记录每次的访问日志的文件地址，后面的 main 是日志的格式样式，对应于 log_format 的 main。

sendfile 参数用于开启高效文件传输模式。将 tcp_nopush 和 tcp_nodelay 两个指令设置为 on 用于防止网络阻塞。

keepalive_timeout 设置客户端链接保持活动的超时时间。在超过这个时间以后，服务器会关闭该链接。

2.4 server 模块

sever 模块是 http 的子模块，它用来定一个虚拟主机。

咱们来看一个简单的 server 是如何作的？

server { # 标志定义虚拟主机开始

listen 8080; # 指定虚拟主机的服务端口

server_name localhost 192.168.12.10 www.yangyi.com; # 指定IP地址或者域名，多个域名之间用空格分开

# 全局定义，若是都是这一个目录，这样定义最简单。

root /Users/yangyi/www;

# root 表示在这整个 server 虚拟主机内，所有的 root web 根目录。注意要和 locate {} 下面定义的区分开来

index index.php index.html index.htm;

# index 全局定义访问的默认首页地址。注意要和 locate {} 下面定义的区分开来

charset utf-8; # 设置网页的默认编码格式

access_log usr/local/var/log/host.access.log main;

# access_log 指定此虚拟主机的访问日志存放路径，最后的 main 用于指定访问日志的输出格式

error_log usr/local/var/log/host.error.log error;

....

}

server 标志定义虚拟主机开始。

listen 用于指定虚拟主机的服务端口。

server_name 用来指定IP地址或者域名，多个域名之间用空格分开。

root 表示在这整个 server 虚拟主机内，所有的 root web 根目录。注意要和 locate {} 下面定义的区分开来。

index 全局定义访问的默认首页地址。注意要和 locate {} 下面定义的区分开来。

charset 用于设置网页的默认编码格式。

access_log 用来指定此虚拟主机的访问日志存放路径，最后的 main 用于指定访问日志的输出格式。

2.5 location 模块

location 模块是 nginx 中用的最多的，也是最重要的模块了，什么负载均衡啊、反向代理啊、虚拟域名啊都与它相关。慢慢来说：

location 根据它字面意思就知道是来定位的，定位 URL，解析 URL，因此，它也提供了强大的正则匹配功能，也支持条件判断匹配，用户能够经过 location 指令实现 Nginx 对动、静态网页进行过滤处理。像咱们的 php 环境搭建就是用到了它。

咱们先来看这个，设定默认首页和虚拟机目录。

location / { # 表示匹配访问根目录

root /Users/yangyi/www; # 指定访问根目录时，虚拟主机的 web 目录

index index.php index.html index.htm; # 设定咱们只输入域名后访问的默认首页地址

}

location / 表示匹配访问根目录。

root 指令用于指定访问根目录时，虚拟主机的web目录，这个目录能够是相对路径（相对路径是相对于nginx的安装目录）。也能够是绝对路径。

index 用于设定咱们只输入域名后访问的默认首页地址，有个前后顺序：index.php index.html index.htm，若是没有开启目录浏览权限，又找不到这些默认首页，就会报403错误。

location 还有一种方式就是正则匹配，开启正则匹配这样：location ~。后面加个~。

下面这个例子是运用正则匹配来连接php。咱们以前搭建环境也是这样作：

location ~ .php$ {

root /Users/yangyi/www;

fastcgi_pass 127.0.0.1:9000; # 连接的是 php-fpm 的地址

fastcgi_index index.php;

include fastcgi.conf;

}

.php$ 熟悉正则的咱们直到，这是匹配 .php 结尾的 URL，用来解析 php 文件。里面的 root 也是同样，用来表示虚拟主机的根目录。

fast_pass 连接的是 php-fpm 的地址。

2.6 upstream 模块

upstream 模块负责负载均衡模块，经过一个简单的调度算法来实现客户端 IP 到后端服务器的负载均衡

upstream iyangyi.com{

ip_hash;

server 192.168.12.1:80;

server 192.168.12.2:80 down;

server 192.168.12.3:8080 max_fails=3 fail_timeout=20s;

server 192.168.12.4:8080;

}

在上面的例子中，经过 upstream 指令指定了一个负载均衡器的名称 iyangyi.com。这个名称能够任意指定，在后面须要的地方直接调用便可。

里面是 ip_hash 这是其中的一种负载均衡调度算法，下面会着重介绍。紧接着就是各类服务器了。用 server 关键字表识，后面接 ip。

Nginx 的负载均衡模块目前支持 4 种调度算法 :

1）weight 轮询（默认）

每一个请求按时间顺序逐一分配到不一样的后端服务器，若是后端某台服务器宕机，故障系统被自动剔除，使用户访问不受影响。weight。指定轮询权值，weight值越大，分配到的访问机率越高，主要用于后端每一个服务器性能不均的状况下。

2）ip_hash

每一个请求按访问IP的hash结果分配，这样来自同一个IP的访客固定访问一个后端服务器，有效解决了动态网页存在的session共享问题。

3）fair

比上面两个更加智能的负载均衡算法。此种算法能够依据页面大小和加载时间长短智能地进行负载均衡，也就是根据后端服务器的响应时间来分配请求，响应时间短的优先分配。Nginx自己是不支持fair的，若是须要使用这种调度算法，必须下载Nginx的upstream_fair模块。

4）url_hash

按访问url的hash结果来分配请求，使每一个url定向到同一个后端服务器，能够进一步提升后端缓存服务器的效率。Nginx自己是不支持url_hash的，若是须要使用这种调度算法，必须安装Nginx 的hash软件包。

在 HTTP Upstream 模块中，能够经过server指令指定后端服务器的IP地址和端口，同时还能够设定每一个后端服务器在负载均衡调度中的状态。经常使用的状态有：

down，表示当前的server暂时不参与负载均衡。

backup，预留的备份机器。当其余全部的非backup机器出现故障或者忙的时候，才会请求backup机器，所以这台机器的压力最轻。

max_fails，容许请求失败的次数，默认为1。当超过最大次数时，返回proxy_next_upstream 模块定义的错误。

fail_timeout，在经历了max_fails次失败后，暂停服务的时间。max_fails能够和fail_timeout一块儿使用。

注意当负载调度算法为ip_hash时，后端服务器在负载均衡调度中的状态不能是weight和backup。

最后传播一个重要的消息，云计算如今白菜价了，2018年各大云计算厂商竞相降价，云服务器低至不到300元/年。如今不论是学习linux，运行长时间工做的爬虫，上线我的App或小程序，搭建网站作我的站长，都是时候上云服务了，错过这一波可能你就掉队。这里整理了一份云计算优惠活动产品列表，点击拿走不谢！

转自：http://blog.51cto.com/13883927/2163916