nginx中location对url匹配;php
语法:location [=|~|~*|^~] /uri/ { … }html
当匹配中符合条件的location,则执行内部指令;若是使用正则表达式,必须使用~*代表不区分大小写或者~区分大小写匹配;例如:location ~* \.(gif|jpg|jpeg)$ ;当配皮成功后,将中止往下匹配;若是没有找到,则使用常规自字符串处理结果;nginx
若是不是用正则表达式;可以使用=严格匹配;web
若是使用^~前缀用于一个常规字符串;表示若是路径匹配,则不测试正则表达式;正则表达式
总结:指令按下列顺序被接受chrome
1:=前缀的指令严格匹配这个查询;若是找到中止往下匹配express
2:挣下的常规字符串,长的在前,若是这个匹配使用^~前缀,匹配中止;浏览器
3:正则表达式,按配置文件的顺序;服务器
4:若是第三步产生匹配。则使用这个结果;中止匹配;不然使用第二部的匹配结果;cookie
四个案例:
location = / { #只匹配/查询 } location / { #匹配任何查询,全部请求都是以/开头。可是正则表达式规则和长的块规则将被优先匹配和查询; } location ^~ /images/ { # 匹配任何已 /images/ 开头的任何查询而且中止搜索。任何正则表达式将不会被测试。 } location ~* \.(gif|jpg|png)${ #匹配任何以gif、jpg、png结尾的请求。而后全部/images/目录的请求将使用第三个 } 例子请求: / -> configuration A /documents/document.html -> configuration B /images/1.gif -> configuration C /documents/1.jpg -> configuration D
八个location案例
location = / { #精确匹配,/后面不能加任何字符串,符合此条件就直接返回数据,再也不像下匹配。 if (-d $request_filename) { root /usr/local/nginx/html/; #当用户访问newweb的时候,则显示此目录的内容,除此以外访问其余的任何目录都不匹配。 [动做A] } location / { # 由于全部的地址都以/开头,因此这条规则将匹配到全部请求,可是非精确匹配会采起正则和最长字符串会优先匹配,所以还会向下继续匹配,好比当访问/bbs的时候,还须要看下面是否更精确的匹配。 [ 动做B] } location /documents/ { # 匹配任何以 /documents/ 开头的地址,匹配符合之后,还要继续往下搜索 # 若是后面的正则表达式都没有匹配到,就匹配这一条 [动做C] } location ^~ /images/ { #匹配任何以/images/ 开头的任何请求而且中止搜索,后面任何正则表达式将不会被测试。 # 匹配任何以 /images/ 开头的地址,匹配符合之后,中止往下搜索正则,采用这一条。 [动做D] } location ~* \.(gif|jpg|jpeg)$ { #~*为不区分大小写 # 匹配全部以 gif,jpg或jpeg 结尾的请求 # 然而,全部请求/images/下的图片会被动做D匹配处理,由于动做D有^~会优先匹配并终止匹配,因此到达不了这一条正则 [动做E] } location /images/ { # 字符匹配到 /images/,继续往下,会发现 ^~ 存在,若是动做D存在,则这一条就不生效。 [动做F] } location /images/abc { #最长字符匹配到 /images/abc,继续往下,会发现 ^~ 存在,若是D存在,则这一条就不生效。 #F与G的放置顺序是没有关系的 [动做G] } location ~ /images/abc/ { # 动做D存在,这一条不生效,若是注销动做D,则会优先最长匹配 动做G 开头的地址,而后向下匹配,到这一条的时候就会匹配并生效。 [ configuration H ] } 匹配优先级,顺序 no优先级: (location =) > (location 完整路径) > (location ^~ 路径) > (location ~,~* 正则顺序) > (location 部分起始路径) > (/) 上面的匹配结果 按照上面的location写法,如下的匹配示例成立: / -> config A 精确彻底匹配,即便/index.html也匹配不了 /downloads/download.html -> config B 匹配B之后,往下没有任何匹配,采用B /images/1.gif -> configuration D 匹配到F,往下匹配到D,中止往下 /images/abc/def -> config D 最长匹配到G,往下匹配D,中止往下 你能够看到 任何以/images/开头的都会匹配到D并中止,FG写在这里是没有任何意义的,H是永远轮不到的,这里只是为了说明匹配顺序 /documents/document.html -> config C 匹配到C,往下没有任何匹配,采用C /documents/1.jpg -> configuration E 匹配到C,往下正则匹配到E /documents/Abc.jpg -> config CC 最长匹配到C,往下正则顺序匹配到CC,不会往下到E
当匹配成功后location中可使用rewrite进行路由重写;
首先须要了解nginx rewrite中可使用到的全局变量;
$args :请求中get的参数,例如a=1&b=2;
$body_remote_add :二进制客户地址
$body_byte_sent :相应时发送出去的body字节数数量,即便连接中断这个数据也是精确的;
$content_length :请求头中的Content_length字段
$content_type :请求中的Content_type字段
$document_root :当前请求在root指令中的位置;服务器中绝对路径
$document_url :与uri相同
$host :请求主机头字段,不然为服务器名称;
$hostname :保存了当前请求中不包含指令的uri,例如:http://www.aaa.com/index.php?a=1中的/index.php;
$host :请求的服务器名称;
$http_user_agent :客户端浏览器的详细信息,若是使用 chrome 和Firefox 则访问结果是
Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.87 Safari/537.36 #chrome的浏览器信息 Mozilla/5.0 (Windows NT 6.1; WOW64; rv:46.0) Gecko/20100101 Firefox/46.0 #Firefox的浏览器信息
$http_cookie : 客户端cookie信息;
$limit_rate :若是nginx服务器中使用limit_rate配置了显示网络速率,则会显示,若是没有则为0
$remote_addr :客户端的地址,每一个客户端的公网ip,
$remote_port :客户端请求nginx服务器时随机打开的端口,这个每一个客户端本身的端口;
$remote_user :已经通过auth basic module验证的用户名
$request_body_file :做反向代理是发给服务端的本地资源名称
$request_method :请求志愿的方式,get\put\delete等
$request_filename :请求的资源文件的路径名称
$request_url :请求参数的原始uri,不包含主机名;如"/index.php?a=1"
$squery_string :保存了url请求的指令,与$args相同
$scheme :请求协议;如http、https、ftp
$server_protacpl :保存了客户端请求资源使用的协议的版本,如http/1.0、http/1.1
$server_addr :保存了服务器ip
$server_name :保存了服务器的主机名;该变量不必定是用户访问的域名,是你的server_name配的地址;
$host :保存了用户访问的域名
$server_port :服务器端口
$uri与$document_uri相同 :不包含指令的uri地址
如www.aaa.com/index.php?a=1&b=2中的index.php
防盗链:注意location生效规则,不然防盗链不起做用。
配置参数说明:
none
'Referer' :来源头部为空的状况
blocked
'Referer' :来源头部不为空,但里面的值被代理或者防火墙删除,这些值都不以http://或者https://开头
server_names
'Referer' :来源头部包含当前的server_name,就是域名
arbitary string :任意字符串,定义服务器名或者可选的url前缀,主机名可使用*开头或者结尾,在检测来源头部这个过程当中,来源域名中的主机端口将会被忽视;
regular expression :正则表达式,表示排除https://或者http://开头的字符串
下面两个案例:
location ~* \.(gif|jpg|png|bmp)$ { valid_referers none blocked *.aaa.com server_names ~\.google\. ~\.baidu\.; if ($invalid_referer) { return 403; #rewrite ^/ http://www.aaa.com/1.jpg; } }
以上全部来至aaa.com和域名中包含google和baidu的站点均可以访问到当前站点的图片,若是来源域名不在这个列表中,那么$invalid_referer等于1,在if语句中返回一个403给用户,这样用户便会看到一个403的页面,若是使用下面的rewrite,那么盗链的图片都会显示403.jpg。若是用户直接在浏览器输入你的图片地址,那么图片显示正常,由于它符合none这个规则.
location ~* \.(gif|jpg|png|swf|flv)$ { # 防盗链设置,对于后缀是gif、jgp等格式的生效 valid_referers none blocked a.com *.a.com; #定义容许访问的请求连接 if ($invalid_referer) { return 404; } } none:在浏览器输入网站域名直接访问的请求,须要容许访问的 blocked:有referer首部,可是referer首部被清除了,通常是防火墙改过的请求 server_name:带服务器名称的,通常是本机或其余服务器的请求,a.com和*.a.com是本公司的域名,要容许访问因而要先容许本机的访问,再禁止其余服务器的访问
location /public/admin/images/y.jpg { #valid_referers none blocked *.aaa.com server_names *.aaa.com ; #valid_referers none blocked www.sss.com; #设置只有该域> 名能够访问 valid_referers none blocked 111.111.111.11; #设置只有该域名能够访> 问 if ($invalid_referer) { rewrite ^ http://baidu.com$request_uri?; return 403; rewrite ^/ http://www.aaa.com/1.jpg; } }
经常使用正则匹配
. : 匹配除换行符之外的任意字符 ? : 重复0次或1次 + : 重复1次或更屡次 * : 重复0次或更屡次 \d :匹配数字 ^ : 匹配字符串的开始 $ : 匹配字符串的介绍 {n} : 重复n次 {n,} : 重复n次或更屡次 [c] : 匹配单个字符c [a-z] : 匹配a-z小写字母的任意一个 小括号()之间匹配的内容,能够在后面经过$1来引用,$2表示的是前面第二个()里的内容。正则里面容易让人困惑的是\转义特殊字符。
参考if判断语句
if ($http_user_agent ~ MSIE) { #若是客户端是微软的IE浏览器,就将请求rewrite到msie目录下。 rewrite ^(.*)$ /msie/$1 break; } if ($http_cookie ~* "id=([^;]+)(?:;|$)") { # 若是cookie匹配正则,就设置变量$id等于正则引用部分 set $id $1; 设置$id等于正则第一个括号内匹配的部分 } if ($request_method = POST) { #若是提交方法为POST,则返回状态405(Method not allowed)。return不能返回301,302 return 405; } if ($slow) { #限速,$slow能够经过 set 指令设置 limit_rate 10k; } if (!-f $request_filename){ #若是请求的文件名不存在,则反向代理到localhost 。这里的break也是中止rewrite检查 break; proxy_pass http://127.0.0.1; } if ($args ~ post=140){ #若是query string中包含"post=140",永久重定向到example.com rewrite ^ http://example.com/ permanent; }
nginx 配置案例参考
http { # 定义image日志格式 log_format imagelog '[$time_local] ' $image_file ' ' $image_type ' ' $body_bytes_sent ' ' $status; # 开启重写日志 rewrite_log on; server { root /home/www; location / { # 重写规则信息 error_log logs/rewrite.log notice; # 注意这里要用‘’单引号引发来,避免{} rewrite '^/images/([a-z]{2})/([a-z0-9]{5})/(.*)\.(png|jpg|gif)$' /data?file=$3.$4; # 注意不能在上面这条规则后面加上“last”参数,不然下面的set指令不会执行 set $image_file $3; set $image_type $4; } location /data { # 指定针对图片的日志格式,来分析图片类型和大小 access_log logs/images.log mian; root /data/images; # 应用前面定义的变量。判断首先文件在不在,不在再判断目录在不在,若是还不在就跳转到最后一个url里 try_files /$arg_file /image404.html; } location = /image404.html { # 图片不存在返回特定的信息 return 404 "image not found\n"; } }