全面理解.htaccess语法中RewriteCond和RewriteRule意义

全面理解.htaccess语法中RewriteCond和RewriteRule意义

.htaccess 配置文件能够经过RewriteCondRewriteRule 实现伪静态。php

RewriteCond的语法

// 含义:当什么东西 匹配 某种模式,则..
RewriteCond TestString CondPattern [Flags]
RewriteCond %{HTTP_HOST} abc.com
  • TestString 是指一个文本格式的条件,如:环境变量名HTTP_HOST所包含的内容(Name= Value),这是一个map(键值对)格式的数据类型。
  • CondPattern 是条件参数,是正则表达式或字符串直接量,如上例就是abc.com。
  • Flags 标识,能够用来紧跟下一个条件,用OR表示或者,若是没有[Flags],则用隐含为AND,表示而且。其它的还能够NC等等,表示忽略大小写

RewriteCond就像咱们程序中的if语句同样,表示若是符合某个或某几个条件则执行RewriteCond下面紧邻的RewriteRule语句,这就是RewriteCond最原始、基础的功能,例如:html

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^Mozilla/5.0.*
# RewriteRule 当条件知足时,把url怎么改写 紧跟在RewriteCond后面
RewriteRule index.php index.m.php
RewriteCond %{HTTP_USER_AGENT} ^Lynx.*
RewriteRule index.php index.L.php
# 上面的条件都不知足时,执行下列这个改写规则
RewriteRule index.php index.b.php

上面语句的做用是当你是用FF浏览器访问index.php这个文件的时候,会自动让你访问到index.m.php这个文件,当你是用一些移动终端访问的 时候,会让你对index.php这个文件的访问实际访问的是index.L.php去,若是你是用其它的浏览器访问的时候,会让你跳到 index.b.php。正则表达式

RewriteRule的语法

# RewriteRule含义:把什么模式的url进行改写
RewriteRule Pattern Substitution [Flags]
  • Pattern 是正则或字符串字面量,表示URL模式,通常为一些文件的扩展名,
  • Substitution 是用来替换URL中匹配pattern的部分
  • Flags R表示redirect(强制重定向),F表示forbidden(禁止访问),L表示last(最后),一般当你但愿中止重写操做而当即重定向时,可用L

.htaccess中用到的正则元字符

  • 元字符^ 匹配你要用来查找的字符串的开头
  • 元字符$ 匹配结尾。

好比一个网站若是要求你填写的QQ号必须为5位到12位数字时,可使用:^\d{5,12}$。apache


介绍

apache 模块mod_rewrite 提供了一个基于正则表达式分析器的重写引擎来实时重写URL请求。 它支持每一个完整规则能够拥有不限数量的子规则以及附加条件规则的灵活并且强大的URL操做机制。 此URL操做能够依赖于各类变量,好比服务器变量、环境变量、HTTP头、时间标记浏览器

此模块能够操做URL的全部部分(包括路径信息部分),在__服务器级的(httpd.conf)__和__目录级的(. htaccess )__配置都有效,还能够生成最终请求字符串。 此重写操做的结果能够是内部子处理,也能够是外部请求的转向,甚至还能够是内部代理处理。安全

这里着重介绍一下RewriteCond 的规则以及参数说明。RewriteCond指令定义了规则生效的条件,即在一个RewriteRule指令以前能够有一个或多个RewriteCond指令。 条件以后的重写规则仅在当前URI与Pattern匹配而且知足此处的条件(TestString可以与CondPattern匹配)时才会起做用。服务器

【说明】定义重写发生的条件
【语法】RewriteCond TestString CondPattern [flags]
【做用域】server config, virtual host, directory, .htaccess
【覆盖项】FileInfo
【状态】 扩展(E)
【模块】mod_rewrite性能

TestString是一个纯文本的字符串,可是还能够包含下列可扩展的成分:
RewriteRule反向引用 ,引用方法是:$N (0 <= N <= 9)引用当前(带有若干RewriteRule指令的)RewriteCond中的与Pattern匹配的捕获分组(圆括号!)。
RewriteCond反向引用 ,引用方法是:%N (1 <= N <= 9)引用当前若干RewriteCond条件中最后符合的条件中的捕获分组(圆括号!)。
RewriteMap扩展 ,引用方法是:${mapname:key|default} 细节请参见RewriteMap指令 。测试

服务器变量 ,引用方法是:%{NAME_OF_VARIABLE} NAME_OF_VARIABLE能够是下表列出的字符串之一:网站

  • HTTP头链接与请求
    • HTTP_USER_AGENT
    • HTTP_REFERER
    • HTTP_COOKIE
    • HTTP_FORWARDED
    • HTTP_HOST
    • HTTP_PROXY_CONNECTION
    • HTTP_ACCEPT REMOTE_ADDR
    • REMOTE_HOST
    • REMOTE_PORT
    • REMOTE_USER
    • REMOTE_IDENT
    • REQUEST_METHOD
    • SCRIPT_FILENAME
    • PATH_INFO
    • QUERY_STRING
    • AUTH_TYPE
  • 服务器自身 日期和时间 其它
    • DOCUMENT_ROOT
    • SERVER_ADMIN
    • SERVER_NAME
    • SERVER_ADDR
    • SERVER_PORT
    • SERVER_PROTOCOL
    • SERVER_SOFTWARE TIME_YEAR
    • TIME_MON
    • TIME_DAY
    • TIME_HOUR
    • TIME_MIN
    • TIME_SEC
    • TIME_WDAY
    • TIME API_VERSION
    • THE_REQUEST
    • REQUEST_URI
    • REQUEST_FILENAME
    • IS_SUBREQ
    • HTTPS

这些变量都对应于相似命名的HTTP MIME头、Apache服务器的C变量、Unix系统中的struct tm字段,其中的大多数在其余的手册或者CGI规范中都有说明。 其中为mod_rewrite所特有的变量以下:

  • IS_SUBREQ
    若是正在处理的请求是一个子请求,它将包含字符串”true”,不然就是”false”。 模块为了解析URI中的附加文件,可能会产生子请求。
  • API_VERSION
    这是正在使用中的Apache模块API(服务器和模块之间内部接口)的版本, 其定义位于include/ap_mmn.h中。 此模块API版本对应于正在使用的Apache的版本(好比在Apache 1.3.14的发行版中这个值是19990320:10)。 一般,对它感兴趣的是模块的开发者。
  • THE_REQUEST
    这是由浏览器发送的完整的HTTP请求行(好比:”GET /index.html HTTP/1.1″)。 它不包含任何浏览器发送的其它头信息。
  • REQUEST_URI
    这是在HTTP请求行中所请求的资源(好比上述例子中的”/index.html”)。
  • REQUEST_FILENAME
    这是与请求相匹配的完整的本地文件系统的文件路径名。
  • HTTPS
    若是链接使用了SSL/TLS,它将包含字符串”on”,不然就是”off”(不管mod_ssl 是否已经加载,该变量均可以安全的使用)。

其它注意事项:
SCRIPT_FILENAME和REQUEST_FILENAME包含的值是相同的——即Apache服务器内部的request_rec结构中的filename字段。

特殊形式:%{ENV:variable} ,其中的variable能够是任意环境变量。 它是经过查找Apache内部结构或者(若是没找到的话)由Apache服务器进程经过getenv()获得的。

特殊形式:%{SSL:variable} ,其中的variable能够是一个SSL环境变量 的名字,不管mod_ssl 模块是否已经加载均可以使用(未加载时为空字符串)。 好比:%{SSL:SSL_CIPHER_USEKEYSIZE}将会被替换为128。

特殊形式:%{HTTP:header} ,其中的header能够是任意HTTP MIME头的名称。 它老是能够经过查找HTTP请求而获得。 好比:%{HTTP:Proxy-Connection}将被替换为Proxy-Connection:HTTP头的值

预设形式:%{LA-U:variable} ,variable的最终值在执行一个内部(基于URL的)子请求后肯定。 当须要使用一个目前未知可是会在以后的过程当中设置的变量的时候,就可使用这个方法。 例如,须要在服务器级配置(httpd.conf文件)中根据REMOTE_USER变量进行重写, 就必须使用%{LA-U:REMOTE_USER}。 由于此变量是由URL重写(mod_rewrite)步骤以后的认证步骤设置的。 可是另外一方面,由于mod_rewrite是经过API修正步骤来实现目录级(.htaccess文件)配置的, 而认证步骤先于API修正步骤,因此能够用%{REMOTE_USER}。

预设形式:%{LA-F:variable} ,variable的最终值在执行一个内部(基于文件名的)子请求后肯定。 大多数状况下和上述的LA-U是相同的。

CondPattern是条件模式,即一个应用于当前TestString实例的正则表达式。TestString将被首先计算,而后再与CondPattern匹配。
注意:CondPattern是一个perl兼容的正则表达式,可是还有若干增补:

  • 在CondPattern串的开头使用’!'(惊叹号)来指定 不匹配 。
  • CondPatterns有若干特殊的变种。 除了正则表达式的标准用法,还有下列用法:
    ‘<CondPattern ‘ (词典顺序的小于)
    将CondPattern视为纯字符串,与TestString按词典顺序进行比较。 若是TestString小于CondPattern则为真。
    ‘>CondPattern ‘ (词典顺序的大于)
    将CondPattern视为纯字符串,与TestString按词典顺序进行比较。 若是TestString大于CondPattern则为真。
    ‘=CondPattern ‘ (词典顺序的等于)
    将CondPattern视为纯字符串,与TestString按词典顺序进行比较。 若是TestString等于CondPattern(两个字符串逐个字符地彻底相等)则为真。 若是CondPattern是”"(两个双引号),则TestString将与空字符串进行比较。
    ‘-d ‘(目录)
    将TestString视为一个路径名并测试它是否为一个存在的目录。
    ‘-f ‘(常规文件)
    将TestString视为一个路径名并测试它是否为一个存在的常规文件。
    ‘-s ‘(非空的常规文件)
    将TestString视为一个路径名并测试它是否为一个存在的、尺寸大于0的常规文件。
    ‘-l ‘(符号链接)
    将TestString视为一个路径名并测试它是否为一个存在的符号链接。
    ‘-x ‘(可执行)
    将TestString视为一个路径名并测试它是否为一个存在的、具备可执行权限的文件。 该权限由操做系统检测。
    ‘-F ‘(对子请求存在的文件)
    检查TestString是否为一个有效的文件,并且能够在服务器当前的访问控制配置下被访问。 它使用一个内部子请求来作检查,因为会下降服务器的性能,因此请谨慎使用!
    ‘-U ‘(对子请求存在的URL)
    检查TestString是否为一个有效的URL,并且能够在服务器当前的访问控制配置下被访问。 它使用一个内部子请求来作检查,因为会下降服务器的性能,因此请谨慎使用!
    注意: 全部这些测试均可以用惊叹号做前缀(‘!’)以实现测试条件的反转。

  • 在CondPattern以后追加特殊的标记[flags] 做为RewriteCond指令的第三个参数。flags是一个以逗号分隔的如下标记的列表:

    ‘nocase|NC ‘(忽略大小写)
    它使测试忽略大小写,扩展后的TestString和CondPattern中’AZ’ 和’a-z’是没有区别的。 此标记仅用于TestString和CondPattern的比较,而对文件系统和子请求的检查不起做用。

    ‘ornext|OR ‘(或下一条件)
    它以OR方式组合若干规则的条件,而不是隐含的AND。 典型的例子以下:

    RewriteCond %{REMOTE_HOST} ^host1.* [OR]
          RewriteCond %{REMOTE_HOST} ^host2.* [OR]
          RewriteCond %{REMOTE_HOST} ^host3.*
          RewriteRule …  # 针对这3个主机的规则集…若是不用[OR]这个标记,你就必需要书写三次条件/规则对。

    举例 : 若是要按请求头中的”User-Agent:”重写一个站点的主页,能够这样写:

    RewriteCond % { HTTP_USER_AGENT }  ^Mozilla.* 
          RewriteRule ^/$ /homepage. max .html  [ L ]
    
          RewriteCond % { HTTP_USER_AGENT }  ^Lynx.* 
          RewriteRule ^/$ /homepage. min .html  [ L ]
    
          RewriteRule ^/$ /homepage .std.html  [ L ]

    解释: 若是你使用的浏览器的userAgent是’Mozilla’,则你将获得内容最大化的主页(含有Frames等等)。 若是你使用的是(基于终端的)Lynx, 则你获得的是内容最小化的主页(不含table等等)。 若是上述条件都不知足(使用的是其余浏览器),则你获得的是一个标准的主页。

相关文章
相关标签/搜索