.htacess详解

.htaccess是什么php

.htaccess文件(或者"分布式配置文件")提供了针对目录改变配置的方法, 即,在一个特定的文档目录中放置一个包含一个或多个指令的文件, 以做用于此目录及其全部子目录。做为用户,所能使用的命令受到限制。管理员能够经过Apache的AllowOverride指令来设置。html

概述来讲,htaccess文件是Apache服务器中的一个配置文件,它负责相关目录下的网页配置。经过htaccess文件,能够帮咱们实现:网页301重定向、自定义404错误页面、改变文件扩展名、容许/阻止特定的用户或者目录的访问、禁止目录列表、配置默认文档等功能。linux

启用.htaccess,须要修改httpd.conf,启用AllowOverride,并能够用AllowOverride限制特定命令的使用。若是须要使用.htaccess之外的其余文件名,能够用AccessFileName指令来改变。例如,须要使用.config ,则能够在服务器配置文件中按如下方法配置:AccessFileName .config 。web

笼统地说,.htaccess能够帮咱们实现包括:文件夹密码保护、用户自动重定向、自定义错误页面、改变你的文件扩展名、封禁特定IP地址的用户、只容许特定IP地址的用户、禁止目录列表,以及使用其余文件做为index文件等一些功能。正则表达式

 

工做原理apache

      .htaccess文件(或者"分布式配置文件")提供了针对每一个目录改变配置的方法,即在一个特定的目录中放置一个包含指令的文件,其中的指令做用于此目录及其全部子目录。
说明:
  若是须要使用.htaccess之外的其余文件名,能够用AccessFileName指令来改变。例如,须要使用.config ,则能够在服务器配置文件中按如下方法配置:
  AccessFileName .config
  一般,.htaccess文件使用的配置语法和主配置文件同样。AllowOverride指令按类别决定了.htaccess文件中哪些指令才是有效的。若是一个指令容许在.htaccess中使用,那么在本手册的说明中,此指令会有一个覆盖项段,其中说明了为使此指令生效而必须在AllowOverride指令中设置的值。安全

 

(不)使用.htaccess文件的场合服务器

      通常状况下,不该该使用.htaccess文件,除非你对主配置文件没有访问权限。有一种很常见的误解,认为用户认证只能经过.htaccess文件实现,其实并非这样,把用户认证写在主配置文件中是彻底可行的,并且是一种很好的方法。
  .htaccess文件应该被用在内容提供者须要针对特定目录改变服务器的配置而又没有root权限的状况下。若是服务器管理员不肯意频繁修改配置,则能够容许用户经过.htaccess文件本身修改配置,尤为是ISP在同一个机器上运行了多个用户站点,而又但愿用户能够本身改变配置的状况下。
  虽然如此,通常都应该尽量地避免使用.htaccess文件。任何但愿放在.htaccess文件中的配置,均可以放在主配置文件的<Directory>段中,并且更高效。
  避免使用.htaccess文件有两个主要缘由。
  首先是性能。若是AllowOverride启用了.htaccess文件,则Apache须要在每一个目录中查找.htaccess文件,所以,不管是否真正用到,启用.htaccess都会致使性能的降低。另外,对每个请求,都须要读取一次.htaccess文件。
  还有,Apache必须在全部上级的目录中查找.htaccess文件,以使全部有效的指令都起做用(参见指令的生效),因此,若是请求/www/htdocs/example中的页面,Apache必须查找如下文件:
  /.htaccess  /www/.htaccess  /www/htdocs/.htaccess  /www/htdocs/example/.htaccess
  总共要访问4个额外的文件,即便这些文件都不存在。(注意,这可能仅仅因为容许根目录"/"使用.htaccess ,虽然这种状况并很少。)cookie

      其次是安全。这样会容许用户本身修改服务器的配置,这可能会致使某些意想不到的修改,因此请认真考虑是否应当给予用户这样的特权。可是,若是给予用户较少的特权而不能知足其须要,则会带来额外的技术支持请求,因此,必须明确地告诉用户已经给予他们的权限,说明AllowOverride设置的值,并引导他们参阅相应的说明,以避免往后生出许多麻烦。
  注意,在/www/htdocs/example目录下的.htaccess文件中放置指令,与在主配置文件中<Directory /www/htdocs/example>段中放置相同指令,是彻底等效的。app

      /www/htdocs/example目录下的.htaccess文件的内容:
  AddType text/example .exm
  httpd.conf文件中摘录的内容:
  <Directory /www/htdocs/example>
  AddType text/example .exm
  </Directory>
  可是,把配置放在主配置文件中更加高效,由于只须要在Apache启动时读取一次,而不是在每次文件被请求时都读取。
  将AllowOverride设置为none能够彻底禁止使用.htaccess文件:
  AllowOverride None

 

指令的做用范围

.htaccess文件中的配置指令做用于.htaccess文件所在的目录及其全部子目录,可是很重要的、须要注意的是,其上级目录也可能会有.htaccess文件,而指令是按查找顺序依次生效的,因此一个特定目录下的.htaccess文件中的指令可能会覆盖其上级目录中的.htaccess文件中的指令,即子目录中的指令会覆盖父目录或者主配置文件中的指令。

 

疑难解答

      若是在.htaccess文件中的某些指令不起做用,可能有多种缘由。
  最多见的缘由是AllowOverride指令没有被正确设置,必须确保没有对此文件区域设置 AllowOverride None 。有一个很好的测试方法,就是在.htaccess文件随便增长点无心义的垃圾内容,若是服务器没有返回了一个错误消息,那么几乎能够判定设置了 AllowOverride None 。
  在访问文档时,若是收到服务器的出错消息,应该检查Apache的错误日志,能够知道.htaccess文件中哪些指令是不容许使用的,也可能会发现须要纠正的语法错误。

 

.htaccess工具

不会写的朋友,在这介绍一款很不错.htaccess的重定向—URL重写工具rewriting-tool

--------------------------------------------------------------------------------

htaccess语法教程

复制代码

RewriteEngine On
RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$
RewriteCond %{REQUEST_URI} !^/blog/
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.*)$ /blog/$1

# 没有输入文件名的默认到到首页
RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$
RewriteRule ^(/)?$ blog/index.php [L]

复制代码

下面我开始解说一下上面的意思:

【RewriteEngine On】
表示重写引擎开,关闭off,做用就是方便的开启或关闭如下的语句,这样就不须要一条一条的注释语句了。

【RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$】
这是重写条件,前面%{HTTP_HOST}表示当前访问的网址,只是指前缀部分,格式是www.xxx.com不包括“http://”和“/”,^表示 字符串开始,$表示字符串结尾,\.表示转义的. ,若是不转义也行,推荐转义,防止有些服务器不支持,?表示前面括号www\.出现0次或1次,这句规则的意思就是若是访问的网址是xxx.com或者 www.xxx.com就执行如下的语句,不符合就跳过。

【RewriteCond %{REQUEST_URI} !^/blog/】
也是重写条件,%{REQUEST_URI}表示访问的相对地址,就是相对根目录的地址,就是域名/后面的成分,格式上包括最前面的“/”,!表示非,这句语句表示访问的地址不以/blog/开头,只是开头^,没有结尾$

【RewriteCond %{REQUEST_FILENAME} !-f】
【RewriteCond %{REQUEST_FILENAME} !-d】
这两句语句的意思是请求的文件或路径是不存在的,若是文件或路径存在将返回已经存在的文件或路径

【RewriteRule ^(.*)$ /blog/$1】
重写规则,最重要的部分,意思是当上面的RewriteCond条件都知足的时候,将会执行此重写规则,^(.*)$是一个正则表达的 匹配,匹配的是当前请求的URL,^(.*)$意思是匹配当前URL任意字符,.表示任意单个字符,*表示匹配0次或N次(N>0),后面 /blog/$1是重写成分,意思是将前面匹配的字符重写成/blog/$1,这个$1表示反向匹配,引用的是前面第一个圆括号的成分,即^(.*)$中 的.* ,其实这儿将会出现一个问题,后面讨论。

【RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$】
【RewriteRule ^(/)?$ blog/index.php [L]】
这两句的意思是指请求的host地址是www.xxx.com是,若是地址的结尾只有0个或者1个“/”时,将会重写到子目录下的主页,我猜测这主要由于重写后的地址是不能自动寻找主页的,须要本身指定。

如今说说出现的问题,RewriteRule ^(.*)$ /blog/$1 前部分 ^(.*)$ 将会匹配当前请求的url。
例如:请求网址是http://www.xxx.com/a.html,究竟是匹配整个http://www.xxx.com/a.html,仍是只匹配/a.html即反斜杠后面的成分,仍是只匹配a.html。
答案是:根据RewriteBase规则规定,若是rewritebase 为/,将会匹配a.html,不带前面的反斜杠,因此上条语句应该写成RewriteRule ^(.*)$ blog/$1(不带/),不过实际应用上带上前面的反斜杠,也能够用,可能带不带都行。如今问题出来了,若是不设置rewritebase 为/ ,将会匹配整个网址http://www.xxx.com/a.html,显然这是错误的,因此应该添加这条:RewiteBase /

还有一个问题是,不能保证每一个人输入的网址都是小写的,若是输入大写的呢,linux系统是区分大小写的,因此应该在RewriteCond后添加[NC]忽略大小写的。

至此,完整的语句应该是:
 

复制代码

RewriteEngine On
RewiteBase /
RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$ [NC]
RewriteCond %{REQUEST_URI} !^/blog/
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.*)$ blog/$1

# 没有输入文件名的默认到到首页
RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$ [NC]
RewriteRule ^(/)?$ blog/index.php [L]

复制代码

若是后面还继续有语句的,就不该该加上最后的[L],由于这是表示最后一条语句的意思。

防盗链的语句,一样须要添加RewiteBase /,以下:

RewriteEngine on
RewiteBase /
RewriteCond %{HTTP_REFERER} !^$ [NC]
RewriteCond %{HTTP_REFERER} !xxx.info [NC]
RewriteRule \.(jpg|gif|png|bmp|swf|jpeg)$ /error/daolian.gif [R,NC,L]

若是后面还继续有语句的,就不该该加上最后的[L],/error/daolian.gif为别人盗链时显示的图片。

 

下面附上简单的语法规则和flags

【RewriteCond语法】
RewriteCond TestString CondPattern [flags]

rewritecond的其余用法:
"-d"(目录)
将TestString视为一个路径名并测试它是否为一个存在的目录。
"-f"(常规文件)
将TestString视为一个路径名并测试它是否为一个存在的常规文件。
"-s"(非空的常规文件)
将TestString视为一个路径名并测试它是否为一个存在的、尺寸大于0的常规文件。
"-l"(符号链接)
将TestString视为一个路径名并测试它是否为一个存在的符号链接。
"-x"(可执行)
将TestString视为一个路径名并测试它是否为一个存在的、具备可执行权限的文件。该权限由操做系统检测。
"-F"(对子请求存在的文件)
检查TestString是否为一个有效的文件,并且能够在服务器当前的访问控制配置下被访问。它使用一个内部子请求来作检查,因为会下降服务器的性能,因此请谨慎使用!
"-U"(对子请求存在的URL)
检查TestString是否为一个有效的URL,并且能够在服务器当前的访问控制配置下被访问。它使用一个内部子请求来作检查,因为会下降服务器的性能,因此请谨慎使用!

【RewriteRule语法:】
RewriteRule Pattern Substitution [flags]

【flags】
"chain|C"(连接下一规则)
此标记使当前规则与下一个规则相连接。它产生这样的效果:若是一个规则被匹配,则继续处理其后继规则,也就是这个标记不起做用;若是该规则不被匹配,则其后继规则将被跳过。好比,在一个目录级规则中执行一个外部重定向时,你可能须要删除”.www”(此处不该该出现”.www”)。

"cookie|CO=NAME:VAL:domain[:lifetime[:path]]"(设置cookie)
在客户端设置一个cookie。cookie的名称是NAME,值是VAL。domain是该cookie的域,好比".apache.org",可选的lifetime是cookie的有效期(分钟),可选的path是cookie的路径。

"env|E=VAR:VAL"(设置环境变量)
此标记将环境变量VAR的值为VAL,VAL能够包含可扩展的正则表达式反向引用($N和%N)。此标记能够屡次使用以设置多个变量。这些变量能够在其后许多状况下被间接引用,一般是在XSSI(<!–#echo var=”VAR”–>)或CGI($ENV{"VAR"})中,也能够在后继的RewriteCond指令的CondPattern参数中经过%{ENV:VAR}引用。使用它能够记住从URL中剥离的信息。

"forbidden|F"(强制禁止URL)
强制禁止当前URL,也就是当即反馈一个HTTP响应码403(被禁止的)。使用这个标记,能够连接若干个RewriteConds来有条件地阻塞某些URL。

"gone|G"(强制废弃URL)
强制当前URL为已废弃,也就是当即反馈一个HTTP响应码410(已废弃的)。使用这个标记,能够标明页面已经被废弃而不存在了。

"handler|H=Content-handler"(强制指定内容处理器)
强自制定目标文件的内容处理器为Content-handler。例如,用来模拟mod_alias模块的ScriptAlias指令,以强制映射文件夹内的全部文件都由”cgi-script”处理器处理。

"last|L"(结尾规则)
当即中止重写操做,并再也不应用其余重写规则。它对应于Perl中的last命令或C语言中的break命令。这个标记用于阻止当前已被重写的URL被后继规则再次重写。例如,使用它能够重写根路径的URL("/")为实际存在的URL(好比:"/e/www/")。

"next|N"(从头再来)
从新执行重写操做(从第一个规则从新开始)。此时再次进行处理的URL已经不是原始的URL了,而是经最后一个重写规则处理过的URL。它对应于Perl中的next命令或C语言中的continue命令。此标记能够从新开始重写操做(当即回到循环的开头)。可是要当心,不要制造死循环!

"nocase|NC"(忽略大小写)
它使Pattern忽略大小写,也就是在Pattern与当前URL匹配时,"A-Z"和"a-z"没有区别。

"noescape|NE"(在输出中不对URI进行转义)
此标记阻止mod_rewrite对重写结果应用常规的URI转义规则。 通常状况下,特殊字符("%", "$", ";"等)会被转义为等值的十六进制编码("%25′, "%24′, "%3B"等)。此标记能够阻止这样的转义,以容许百分号等符号出如今输出中,好比:
RewriteRule /foo/(.*) /bar?arg=P1\%3d$1 [R,NE]
可使"/foo/zed转向到一个安全的请求"/bar?arg=P1=zed"。

"nosubreq|NS"(不对内部子请求进行处理)
在当前请求是一个内部子请求时,此标记强制重写引擎跳过该重写规则。好比,在mod_include试图搜索目录默认文件(index.xxx)时,Apache会在内部产生子请求。对于子请求,重写规则不必定有用,并且若是整个规则集都起做用,它甚至可能会引起错误。因此,能够用这个标记来排除某些规则。
使用原则:若是你为URL添加了CGI脚本前缀,以强制它们由CGI脚本处理,但对子请求处理的出错率(或者资源开销)很高,在这种状况下,可使用这个标记。

"proxy|P"(强制为代理)
此标记使替换成分被内部地强制做为代理请求发送,并当即中断重写处理,而后把处理移交给mod_proxy模块。你必须确保此替换串是一个可以被mod_proxy处理的有效URI(好比以http://hostname开头),不然将获得一个代理模块返回的错误。使用这个标记,能够把某些远程成分映射到本地服务器域名空间,从而加强了ProxyPass指令的功能。
注意:要使用这个功能,必须已经启用了mod_proxy模块。

"passthrough|PT"(移交给下一个处理器)
此标记强制重写引擎将内部request_rec结构中的uri字段设置为filename字段的值,这个小小的修改使得RewriteRule指令的输出可以被(从URI转换到文件名的)Alias, ScriptAlias, Redirect等指令进行后续处理[原文:This flag is just a hack to enable post-processing of the output of RewriteRule directives, using Alias, ScriptAlias, Redirect, and other directives from various URI-to-filename translators.]。举一个能说明其含义的例子: 若是要将/abc重写为/def, 而后再使用mod_alias将/def转换为/ghi,能够这样:
RewriteRule ^/abc(.*) /def$1 [PT]
Alias /def /ghi
若是省略了PT标记,虽然将uri=/abc/…重写为filename=/def/…的部分运做正常,可是后续的mod_alias在试图将URI转换到文件名时会遭遇失效。
注意:若是须要混合使用多个将URI转换到文件名的模块时,就必须使用这个标记。。此处混合使用mod_alias和mod_rewrite就是个典型的例子。

"qsappend|QSA"(追加查询字符串)
此标记强制重写引擎在已有的替换字符串中追加一个查询字符串,而不是简单的替换。若是须要经过重写规则在请求串中增长信息,就可使用这个标记。

"redirect|R [=code]"(强制重定向)
若Substitution以http://thishost[:thisport]/(使新的URL成为一个URI)开头,能够强制性执行一个外部重定向。若是没有指定code,则产生一个HTTP响应码302(临时性移动)。若是须要使用在300-400范围内的其余响应代码,只需在此指定便可(或使用下列符号名称之一:temp(默认), permanent, seeother)。使用它能够把规范化的URL反馈给客户端,如将”/~”重写为”/u/”,或始终对/u/user加上斜杠,等等。
注意:在使用这个标记时,必须确保该替换字段是一个有效的URL。不然,它会指向一个无效的位置!而且要记住,此标记自己只是对URL加上http://thishost[:thisport]/前缀,重写操做仍然会继续进行。一般,你还会但愿中止重写操做而当即重定向,那么就还须要使用"L'标记。

"skip|S=num"(跳事后继规则)
此标记强制重写引擎跳过当前匹配规则以后的num个规则。它能够模拟if-then-else结构:最后一个规则是then从句,而被跳过的skip=N个规则是else从句。注意:它和"chain|C"标记是不一样的!

"type|T=MIME-type"(强制MIME类型)
强制目标文件的MIME类型为MIME-type,能够用来基于某些特定条件强制设置内容类型。好比,下面的指令可让.php文件在以.phps扩展名调用的状况下由mod_php按照PHP源代码的MIME类型(application/x-httpd-php-source)显示:
RewriteRule ^(.+\.php)s$ $1 [T=application/x-httpd-php-source]

 

.htaccess实例

http://cloudbbs.org/forum.php?mod=viewthread&tid=7455&page=1&extra=#pid41053
http://www.chinaz.com/web/2010/0415/111514.shtml

 

 

参考:http://baike.baidu.com/view/91163.htm
        http://hi.baidu.com/wojiubaibudu/item/4b3513c74a8fe47aced4f817

相关文章
相关标签/搜索