URL重写

Apache的URL地址重写
http://hi.baidu.com/sonan/blog/item/c408963d89468208bba16716.html
第一种方法:Apache环境中若是要将URL地址重写,正则表达式是最基本的要求,但对于通常的URL地址来讲,基本的匹配就能实现咱们大部分要求,所以除非 是很是特殊的URL地址,但这不是我要讨论的范围,简单几招学会Apache中URL地址重写,经过实例展现,轻松学会URL地址重写:
URL实例
重写URL:http://www.baidu.com/?p=152
原始URL:http://www.baidu.com/p152.html
重写规则:
^p([0-9]+)\.html      /?p=$1     [L]
正则基础知识:
^ 匹配行的开始,匹配URL地址的开头部分,对于RewriteRule而言,域名(http://www.biuuu.com)不是URL地址的一部分,如上:?p=152
() 分隔一个被捕获的表达式,如上:([0-9]+)
[] 定义字符类,如上:[0-9] 表示从0-9的数字
+ 说明前面的字符能够被重复匹配1次或数次,如上:[0-9]+,表示任何数字组合
\ 字符转义,如上:转义.
其它:
[L] 表示last,中止匹配其它
方法以下:
1,打开httpd.conf文件,找到
#LoadModule rewrite_module modules/mod_rewrite.so 注释前面#
2,打开httpd-vhosts.conf文件,在VirtualHost添加剧写规则,
RewriteEngine On
RewriteRule ^p([0-9]+)\.html      /?p=$1     [L]
基本上就上面这两个步骤,其实总的来讲,Apache中URL地址重写仍是比较简单的,比看文档学习要快的多,不过要想深刻了解仍是有必要看看相关文档的,其它规则能够自定义。记住一点:任何匹配其实就是一个正则表达式的替换过程。
建立友好的搜索引擎URL地址对于PHP程序员来讲很是重要,所以简单学会Apache中URL地址重写将是一项最基本的要求。
第二种方法:
1,首先检查是否已安装rewrite模块:
cat httpd.conf | grep rewrite
LoadModule rewrite_module modules/mod_rewrite.so
2,生成伪静态html链接:
(1)生成伪静态html
在<VirtualHost>段最后加入
RewriteEngine on
RewriteRule /goods([0-9]+).html /goods.php?id=$1 [PT] 
更标准的写法为:
RewriteRule ^(.*)/goods([0-9]+).html$ $1/goods.php?id=$2 [PT]
更简洁的写法:
/goods(\d+)\.html /goods\.php\?id=$1
第一个(0-9]+)对应参数$1,以此类推第二个对应$2
举例:
RewriteRule /forum-([0-9]+)-([0-9]+)\.html /forumdisplay.php?fid=$1&page=$2 [PT]
测试http://www.xxx.com/goods1.html 是否与/goods.php?id=1的内容相同
最后将全部连接换成设置后的伪静态html地址方式
[PT]:url全局转换,即转换过的goods31.html对应goods.php?id=31 (默认就是这个不加参数)
[R]:    url重定向  即便用goods31.html访问时跳转到goods.php?id=31
3,防盗链:
RewriteCrond %{HTTP_HOST} !upkiller.com [R=301,L]
RewriteRule ^(.*)$ http://www.upkiller.com/warning.html [R=301,L]
把不是来自upkiller.com的请求重定向到http://www.upkiller.com
更好的作法:
RewriteCond %{HTTP_REFERER} !^http://(www\.)?upkiller\.com/.*$ [NC]
RewriteRule \.(mp3|rar|jpe|gif)$ http://www.upkiller.com/warning.jpg [R=301,L]
4,防百度爬虫:
RewriteCond %{HTTP_USER_AGENT} ^Baiduspider [OR]
RewriteRule ^(.*)$ http://www.google.com [R=301,L]
把来自百度的爬虫转到goole
PS:PHP伪静态方式
方法一: 
好比这个网页 
http://www.xxxx.com/soft.php/1,100,8630.html 
其实处理的脚本是soft.php 参数为1,100,8630 
至关于soft.php?a=1&b=1=100&c=8630 只不过这样的URL太难记。搜索引擎也不喜欢。 
真静态只是彻底生成了HTML。 
客户端访问的时候直接输出。不用脚本解释。在流量很是大的时候(好比天天有上百万的访问量的时候)会起到很好的效果。也就是说服务器端实实在在的存在这个HTML页面。 
固然在你网站的流量没有那么大的时候。URL重写是最好的方法(我的观点,大流量的时候能够考虑负载均衡了。一样没有关系) 
附URL重写的方法有不少种,APACHE,IISREWRITE。甚至PHP脚本均可以直接处理。好比上例中就是PHP脚本直接处理(该方法好处是大流量的时候直接减轻WEB伺服器的压力。PS:一样也是我的观点: 
================================================ 
下面以程序为例讲一下PHP伪静态的程序实现方法,其实这方法我以前已经有在其它论坛社区发过 
程序为例: 
http://www.xxxx.com/soft.php/1,100,8630.html 
CODE: 
//利用server变量 取得PATH_INFO信息 该例中为 /1,100,8630.html 也就是执行脚本名后面的部分 
if(@$path_info =$_SERVER["PATH_INFO"]){ 
//正则匹配一下参数 
if(preg_match("/\/(\d+),(\d+),(\d+)\.html/si",$path_info,$arr_path)){ 
$gid =intval($arr_path[1]); //取得值 1 
$sid =intval($arr_path[2]); //取得值100 
$softid =intval($arr_path[3]); //取得值8630 
}else die("Path:Error!"); 
//至关于soft.php?gid=1&sid=100&softid=8630 
//就是这么简单了。~) 
方法二: 
一 打开 Apache 的配置文件 httpd.conf 。 
二 将#LoadModule rewrite_module modules/mod_rewrite前面的#去掉 
三 在 httpd.conf中添加: 
<IfModule mod_rewrite.c> 
RewriteEngine On 
#RewriteCond %{ENV:SCRIPT_URL} (?:index|dispbbs)[-0-9]+.html 
RewriteRule ^(.*?(?:index|dispbbs))-([-0-9]+).html 1.php?__is_apache_rewrite=1&__rewrite_arg=2 
</IfModule> 
四 要实现asp帖子URL到php帖子的映射,在 第三步的<IfModule mod_rewrite.c>和</IfModule>之间添加: 
RewriteMap tolowercase int:tolower 
RewriteCond %{QUERY_STRING} (?:boardid|page|id|replyid|star|skin)=d+ [NC] 
RewriteRule ^(.*(?:index|dispbbs)).asp 1.php?{tolowercase:%{QUERY_STRING}}&__is_apache_rewrite=1 
五 保存httpd.conf并重启Apache 
方法三: 
<?php 
/* 
功能:PHP伪静态化页面的实现 
具体用法: 
例如连接为:test.php/year/2006/action/_add.html 
mod_rewrite(); 
$yearn=$_GET["year"];//结果为'2006' 
$action=$_GET["action"];//结果为'_add' 
*/ 
function mod_rewrite(){ 
global $_GET; 
$nav=$_SERVER["REQUEST_URI"]; 
$script_name=$_SERVER["SCRIPT_NAME"]; 
$nav=substr(ereg_replace("^$script_name","",urldecode($nav)),1); 
$nav=preg_replace("/^.ht(m){1}(l){0,1}$/","",$nav);//这句是去掉尾部的.html或.htm 
$vars = explode("/",$nav); 
for($i=0;$i<Count($vars);$i+=2){ 
$_GET["$vars[$i]"]=$vars[$i+1]; 

return $_GET; 

mod_rewrite(); 
$yearn=$_GET["year"];//结果为'2006' 
$action=$_GET["action"];//结果为'_add' 
echo $yearn; 
echo $action; 
?> 
<?php 
/* 
功能:PHP伪静态化页面的实现 
具体用法: 
例如连接为:test.php/year/2006/action/_add.html 
mod_rewrite(); 
$yearn=$_GET["year"];//结果为'2006' 
$action=$_GET["action"];//结果为'_add' 
*/ 
function mod_rewrite(){ 
global $_GET; 
$nav=$_SERVER["REQUEST_URI"]; 
$script_name=$_SERVER["SCRIPT_NAME"]; 
$nav=substr(ereg_replace("^$script_name","",urldecode($nav)),1); 
$nav=preg_replace("/^.ht(m){1}(l){0,1}$/","",$nav);//这句是去掉尾部的.html或.htm 
$vars = explode("/",$nav); 
for($i=0;$i<Count($vars);$i+=2){ 
$_GET["$vars[$i]"]=$vars[$i+1]; 

return $_GET; 

mod_rewrite(); 
$yearn=$_GET["year"];//结果为'2006' 
$action=$_GET["action"];//结果为'_add' 
echo $yearn; php

echo $action;html

=====================================================================================================================程序员

 

Apache的Mod_rewrite学习 (RewriteCond重写规则的条件)
RewriteCond Syntax: RewriteCond TestString CondPattern [flags]   RewriteCond指令定义一条规则条件。在一条RewriteRule指令前面可能会有一条或多条RewriteCond指令,只有当自身的模 板(pattern)匹配成功且这些条件也知足时规则才被应用于当前URL处理。   TestString是一个字符串,除了包含普通的字符外,还能够包括下列的可扩展结构:
1.       $N,RewriteRule后向引用,其中(0 <= N <= 9)   $N引用紧跟在RewriteCond后面的RewriteRule中模板中的括号中的模板在当前URL中匹配的数据。
2.       %N,RewriteCond后向引用,其中(0 <= N <= 9)   %N引用最后一个RewriteCond的模板中的括号中的模板在当前URL中匹配的数据。
3.       ${mapname:key|default},RewriteMap扩展. 具体参见RewriteMap 
4.       %{ NAME_OF_VARIABLE } ,服务器变量。 变量的名字以下表(分类显示) 
   正则表达式

5.       express

6.       特别说明:
o        SCRIPT_FILENAME和REQUEST_FILENAME变量含有相同的值,也就是Apache服务器内部数据结构request_rec的 filename字段的值。第一个变量是一个CGI变量,而第二个则与REQUEST_URI(含有request_rec数据结构中uri字段的值)保 持一致。
o        %{ENV:variable}中的variable能够是任何环境变量的名字。对其值的查找,先经过Apache内部的数据结构,(如找不到)再在Apache服务器进程中经过getenv()查找。
o        %{HTTP:header}中的header能够是任何HTTP MIME-header的名字,其值经过查找HTTP请求信息而得。
o        %{LA-U:variable} 用来引用后续API阶段中定义的、当前还不知道的值,具体实现是经过执行一个基于URL的内部的sub-request来决定的variable的最终的 值。例如,假如你想在服务器范围内利用REMOTE_USER的值来完成重写,但这个值是在验证阶段设置的,而验证阶段是在URL转换阶段的后面。从另外一 方面讲,因为mod_rewrite在修补(fixup)API阶段进行目录范围的重写,而修补阶段在验证阶段的后面,因此此时只要用% {REMOTE_USER}就能够取得该值了。
o        %{LA-F:variable},执行一个基于文件名字(filename)的内部sub-request来决定variable的最终的值。大多数时间内,这和LA-U相同。
  CondPattern是一个条件模板,也就是说,是一个扩展正则式(extended regular expression),用与跟TestString进行匹配。做为一个标准的扩展正则式,CondPattern有如下补充:
1.       能够在模板串前增长一个!前缀,以用表示不匹配模板。但并非全部的test均可以加!前缀。
2.       CondPattern中可使用如下特殊变量:
o        '<CONDPATTERN' (小于,基于字母顺序) 将condPattern看成一个普通字符串,将它和TestString进行比较,当TestString 的字符小于CondPattern为真. 
o        '>CondPattern' (大于) 将condPattern看成一个普通字符串,将它和TestString进行比较,当TestString 的字符大于CondPattern为真. 
o        '=CondPattern' (等于) 将condPattern看成一个普通字符串,将它和TestString进行比较,当TestString 与CondPattern彻底相同时为真.若是CondPattern只是 "" (两个引号紧挨在一块儿) 此时需TestString 为空字符串方为真. 
o        '-d' (是否为目录) 将testString看成一个目录名,检查它是否存在以及是不是一个目录. 
o        '-f' (是不是regular file) 将testString看成一个文件名,检查它是否存在以及是不是一个regular文件. 
o        '-s' (是否为长度不为0的regular文件) 将testString看成一个文件名,检查它是否存在以及是不是一个长度大于0的regular文件
o        '-l' (是否为symbolic link) 将testString看成一个文件名,检查它是否存在以及是不是一个 symbolic link. 
o        '-F' (经过subrequest来检查某文件是否可访问) 检查TestString是不是一个合法的文件,并且经过服务器范围内的当前设置的访问控制进行访问。这个检查是经过一个内部subrequest完成 的, 所以须要当心使用这个功能以下降服务器的性能。
o        '-U' (经过subrequest来检查某个URL是否存在) 检查TestString是不是一个合法的URL,并且经过服务器范围内的当前设置的访问控制进行访问。这个检查是经过一个内部subrequest完成 的, 所以须要当心使用这个功能以下降服务器的性能。
  [flags]是第三个参数,多个标志之间用逗号分隔。
1.       'nocase|NC' (不区分大小写)   在扩展后的TestString和CondPattern中,比较时不区分文本的大小写。注意,这个标志对文件系统和subrequest检查没有影响. 
2.       'ornext|OR' (创建与下一个条件的或的关系)   默认的状况下,二个条件之间是AND的关系,用这个标志将关系改成OR。例如: RewriteCond %{REMOTE_HOST} ^host1.* [OR] RewriteCond %{REMOTE_HOST} ^host2.* [OR] RewriteCond %{REMOTE_HOST} ^host3.* RewriteRule ... 若是没有[OR]标志,须要写三个条件/规则.
例子:根据客户端浏览器的不一样,返回不一样的首页面。 RewriteCond %{HTTP_USER_AGENT} ^Mozilla.* RewriteRule ^/$ /homepage.max.html [L] RewriteCond %{HTTP_USER_AGENT} ^Lynx.* RewriteRule ^/$ /homepage.min.html [L] RewriteRule ^/$ /homepage.std.html [L] 
当你在地址栏里输入 sina.com.cn  google.cnapache

看看有什么变化?是否是会自动跳转到 www.sina.com.cn    www.google.cn浏览器

这一技术经过apache的rewrite能够实现,固然你得把 不带www的域名指向你服务器的IP安全

 要是虚拟主机的话,得在viralhost段加入 ServerAlias xxx.com服务器

而后打开重写引擎功能数据结构

 RewriteEngine On

能过rewritecond判断主机名是否带www

RewriteCond %{HTTP_HOST}  ^xxx\.com$ [NC]

而后来一条

RewriteRule ^/(.*)$  http://www.xxx.com/$1 [R=301,L]

OK,重起apache,如今在浏览器中输入 xxx.com 看看是否是自动变成了 www.xxx.com 了呢。

从新整理一下就是:

RewriteEngine On

RewriteCond %{HTTP_HOST} ^xxx\.com$ [NC]

RewriteRule ^/(.*)$  http://www.xxx.com/$1 [R=301,L]

 

源地址: http://blog.csdn.net/keyunq/archive/2008/06/11/2536875.aspx

一 .RewriteRule

Syntax: RewriteRule Pattern Substitution [flags]

  一条RewriteRule指令,定义一条重写规则,规则间的顺序 很是重要。对Apache1.2及之后的版本,模板(pattern)是一个POSIX正则式,用以匹配当前的URL。当前的URL不必定是用记最初提交 的URL,由于可能用一些规则在此规则前已经对URL进行了处理。


  对mod_rewrite来讲,!是个合法的模板前缀,表示“非”的意思,这对描述“不知足某种匹配条件”的状况很是方便,或用做最后一条默认规则。当使用!时,不能在模板中有分组的通配符,也不能作后向引用。

  当匹配成功后,Substitution会被用来替换相应的匹配,它除了能够是普通的字符串之外,还能够包括: 
1. $N,引用RewriteRule模板中匹配的 相关 字串,N表示序号,N=0..9 
2. %N,引用最后一个RewriteCond模板中匹配的数据,N表示序号 
3. %{VARNAME},服务器变量 
4. ${mapname:key|default},映射函数调用


这些特殊内容的扩展,按上述顺序进行。
  一个URL的所有相关部分都会被Substitution替换,并且这个替换过程会一直持续到全部的规则都被执行完,除非明确地用L标志中断处理过程。
  当susbstitution有”-”前缀时,表示不进行替换,只作匹配检查。
   利用RewriteRule,可定义含有请求串(Query String)的URL,此时只需在Sustitution中加入一个?,表示此后的内容放入QUERY_STRING变量中。若是要清空一个 QUERY_STRING变量,只须要以?结束Substitution串便可。
  若是给一个Substitution增长一个

1. 'redirect|R [=code]' (强制重定向)
  给当前的URI增长前缀

2. 'forbidden|F' (强制禁止访问URL所指的资源)
  当即返回状态值403 (FORBIDDEN)的应答包。将这个标志与合适的RewriteConds 联合使用,能够阻断访问某些URL。

3. 'gone|G' (强制返回URL所指资源为不存在(gone))
  当即返回状态值410 (GONE)的应答包。用这个标志来标记URL所指的资源永久消失了.

4. # 'proxy|P' (强制将当前URL送往代理模块(proxy module))
  这个标志,强制将substitution看成一个发向代理模块的请求,并当即将共送往代理模块。所以,必须确保substitution串是一个合法的URI (如, 典型的状况是以

5. 'last|L' (最后一条规则)
  停止重写流程,再也不对当前URL施加更多的重写规则。这至关于perl的last命令或C的break命令。

6. 'next|N' (下一轮)
  从新从第一条重写规则开始执行重写过程,新开的过程当中的URL不该当与最初的URL相同。 这至关于Perl的next命令或C的continue命令. 千万当心不要产生死循环。

7. # 'chain|C' (将当前的规则与其后续规则綑绑(chained))
  当规则匹配时,处理过程与没有綑绑同样;若是规则不匹配,则綑绑在一块儿的后续规则也不在检查和执行。

8. 'type|T=MIME-type' (强制MIME类型)
  强制将目标文件的MIME-type为某MIME类型。例如,这可用来模仿mod_alias模块对某目录的ScriptAlias指定,经过强制将该目录下的全部文件的类型改成 “application/x-httpd-cgi”.

9. 'nosubreq|NS' (used only if no internal sub-request )
   这个标志强制重写引擎跳过为内部sub-request的重写规则.例如,当mod_include试图找到某一目录下的默认文件时 (index.xxx),sub-requests 会在Apache内部发生. Sub-requests并不是老是有用的,在某些状况下若是整个规则集施加到它上面,会产生错误。利用这个标志可排除执行一些规则。

10. 'nocase|NC' (模板不区分大小写)

这个标志会使得模板匹配当前URL时忽略大小写的差异。

11. 'qsappend|QSA' (追加请求串(query string))
  这个标志,强制重写引擎为Substitution的请求串追加一部分串,则不是替换掉原来的。借助这个标志,可使用一个重写规则给请求串增长更多的数据。

12. 'noescape|NE' (不对输出结果中的特殊字符进行转义处理)
   一般状况下,mod_write的输出结果中,特殊字符(如'%', '$', ';', 等)会转义为它们的16进制形式(如分别为'%25', '%24', and '%3B')。这个标志会禁止mod_rewrite对输出结果进行此类操做。 这个标志只能在 Apache 1.3.20及之后的版本中使用。

13. 'passthrough|PT' (经过下一个处理器)
   这个标志强制重写引擎用filename字段的值来替换内部request_rec数据结构中uri字段的值。. 使用这个标志,可使后续的其它URI-to-filename转换器的Alias、ScriptAlias、Redirect等指令,也能正常处理 RewriteRule指令的输出结果。用一个小例子来讲明它的语义:若是要用mod_rewrite的重写引擎将/abc转换为/def,而后用 mod_alas将/def重写为ghi,则要:
RewriteRule ^/abc(.*) /def$1 [PT]
Alias /def /ghi
如 果PT标志被忽略,则mod_rewrite也能很好完成工做,若是., 将 uri=/abc/... 转换为filename=/def/... ,彻底符合一个URI-to-filename转换器的动做。接下来 mod_alias 试图作 URI-to-filename 转换时就会出问题。
注意:若是要混合都含有URL-to-filename转换器的不一样的模块的指令,必须用这个标志。最典型的例子是mod_alias和mod_rewrite的使用。

14. 'skip|S=num' (跳事后面的num个规则)
  当前规则匹配时,强制重写引擎跳事后续的num个规则。用这个能够来模仿if-then-else结构:then子句的最后一条rule的标志是skip=N,而N是else子句的规则条数。

15. 'env|E=VAR:VAL' (设置环境变量)
   设置名为VAR的环境变量的值为VAL,其中VAL中能够含有正则式的后向引用($N或%N)。这个标志可使用屡次,以设置多个环境变量。这儿设置的 变量,能够在多种状况下被引用,如在XSSI或CGI中。另外,也能够在RewriteCond模板中以%{ENV:VAR}的形式被引用。

16. 

   注意:必定不要忘记,在服务器范围内的配置文件中,模板(pattern)用以匹配整个URL;而在目录范围内的配置文件中,目录前缀老是被自动去掉后再 进行模板匹配的,且在替换完成后自动再加上这个前缀。这个功能对不少种类的重写是很是重要的,由于若是没有去前缀,则要进行父目录的匹配,而父目录的信息 并非总能获得的。一个例外是,当substitution中有http://打头时,则再也不自动增长前缀了,若是P标志出现,则会强制转向代理。

注 意:若是要在某个目录范围内启动重写引擎,则须要在相应的目录配置文件中设置“RewriteEngine on”,且目录的“Options FollowSymLinks”必须设置。若是管理员因为安全缘由没有打开FollowSymLinks,则不能使用重写引擎。

http://hostname 开头),不然会从代理模块获得一个错误. 这个标志,是ProxyPass指令的一个更强劲的实现,将远程请求(remote stuff)映射到本地服务器的名字空间(namespace)中来。
   注意,使用这个功能必须确保代理模块已经编译到Apache 服务器程序中了. 能够用“httpd -l ”命令,来检查输出中是否含有mod_proxy.c来确认一下。若是没有,而又须要使用这个功能,则须要从新编译``httpd''程序并使用 mod_proxy有效。 http://thishost[:thisport]/ , 从而生成一个新的URL,强制生成一个外部重定向(external redirection,指生的URL发送到客户端,由客户端再次以新的URL发出请求,虽然新URL仍指向当前的服务器). 若是没有指定的code值,则HTTP应答以状态值302 (MOVED TEMPORARILY),若是想使用300-400(不含400)间的其它值能够经过在code的位置以相应的数字指定,也能够用标志名指定: temp (默认值), permanent, seeother.

注意,当使用这个标志时,要确实substitution是个合法的URL,这个标志只是在URL前增长http://thishost[:thisport]/ 前缀而已,重写操做会继续进行。若是要当即将新URL重定向,用L标志来中重写流程。http://thishost[:port ]的前缀,则mod_rewrite会自动将此前缀去掉。所以,利用 http://thisthost 作一个无条件的重定向到本身,将难以奏效。要实现这种效果,必须使用R标志。   Flags是可选参数,当有多个标志同时出现时,彼此间以逗号分隔。

相关文章
相关标签/搜索