1、原理特色
css
Varnish是一个轻量级的cache和反向代理软件,有如下的优缺点:html
(1)基于内存进行缓存,速度比squid的硬盘缓存要快;可是varnish进程一旦出了问题,缓存数据就丢失了,后端的web服务器的压力会瞬间加大;web
(2)使用自有的VCL(Varnish Configuation Languege)管理,强大灵活;正则表达式
(3)经过管理端口,利用正则表达式删除指定的缓存;编程
(4)基于内存IO较高,TCP连接释放快,能够支持较高的并发;同时,CPU\内存的开销较高;后端
(5)支持0-60秒的精确缓存时间;缓存
2、安装Varnish服务器
Varnish的安装很是简单,下面逐步介绍:
一、安装前的准备
Varnish安装环境以下表1所示:
表1
主机名 操做系统 IP地址
Varnish-server CentOS release 5.4 192.168.12.246
Web-server CentOS release 5.4 192.168.12.26
接着,创建varnish用户以及用户组,而且建立Varnish缓存目录和日志目录:
[root@varnish-server ~]#useradd -s /sbin/nologin varnish
[root@varnish-server ~]#mkdir /data/varnish/cache
[root@varnish-server ~]#mkdir /data/varnish/log
[root@varnish-server ~]#chown -R varnish:varnish /data/varnish/cache
[root@varnish-server ~]#chown -R varnish:varnish /data/varnish/log
二、获取varnish软件
Varnish的官方站点为http://varnish-cache.org,这里面有varnish的最新说明文档,以及版本升级记录,今后站点能够找到varnish在SourceForge的下载连接,目前,varnish的最新版本是Varnish 2.1.2,下载完成后的包名为varnish-2.1.2.tar.gz,此处咱们就以此版本为例,进行安装配置。
三、安装pcre
若是没有安装Pcre,在编译varnish2.0以上版本时,会提示找不到pcre库,而pcre库是为了兼容正则表达式,因此必须先安装pcre库。
[root@varnish-server ~]#tar zxvf pcre-7.9.tar.gz
[root@varnish-server ~]#cd pcre-7.9/
[root@varnish-server ~]#./configure --prefix=/usr/local/pcre/
[root@varnish-server ~]#make && make install
四、安装varnish
这里咱们将varnish安装到/usr/local/目录下,操做以下:
[root@varnish-server ~]#tar -zxvf varnish-2.1.2.tar.gz
[root@varnish-server ~]#cd varnish-2.1.2
[root@varnish-server ~]#export PKG_CONFIG_PATH=/usr/local/pcre/lib/pkgconfig
[root@varnish-server ~]#./configure --prefix=/usr/local/varnish \
>--enable-dependency-trackin
>--enable-debugging-symbols
>--enable-developer-warnings
[root@varnish-server ~]#make
[root@varnish-server ~]#make install
[root@varnish-server ~]#cp redhat/varnish.initrc /etc/init.d/varnish
[root@varnish-server ~]#cp redhat/varnish.sysconfig /etc/sysconfig/varnish
其中,“PKG_CONFIG_PATH”是指定varnish查找pcre库的路径,若是pcre安装在了其它路径下,在这里指定相应的路径便可,Varnish默认查找的pcre库路径为/usr/local/lib/ pkgconfig。最后两步操做是拷贝一些varnish守护进程的初始化脚本文件,这些脚本用于varnish的启动、关闭管理等方面,在下面章节中会进行详细讲解。
至此,varnish安装完毕。
并发
3、配置Varnishjsp
一、VCL使用说明
VCL,即为Varnish Configuation Language,用来定义varnish的存取策略,VCL语法比较简单,跟C和perl比较类似,可使用指定运算符“=”,比较运算符“==”,逻辑运算符“!,&&,!!”等形式。还支持正则表达样和用“~”进行ACL匹配运算,同时还可使用“set”这样的关键字来指定变量。
须要注意的是,“\”字符在VCL里没有特别的含义,这点与其它语言略有不一样,另外,VCL只是配置,并非真正的编程语言,没有循环,也没有自定义变量。
在讲述Varnish配置以前,首先须要了解下varnish的配置语法,即VCL,下面对VCL经常使用的一些内置函数和公用变量进行详细介绍。
VCL内置函数
(1)vcl_recv函数
用于接收和处理请求,当请求到达并成功接收后被调用,经过判断请求的数据来决定如何处理请求。
此函数通常以以下几个关键字结束:
pass:表示进入pass模式,把请求控制权交给vcl_pass函数。
pipe:表示进入pipe模式,把请求控制权交给vcl_pipe函数。
error code [reason]:表示返回“code”给客户端,并放弃处理该请求,“code”是错误标识,例如200、405等,“reason”是错误提示信息。
(2)vcl_pipe函数
此函数在进入pipe模式时被调用,用于将请求直接传递至后端主机,在请求和返回的内容没有改变的状况下,将不变的内容返回给客户端,直到这个连接关闭。
此函数通常以以下几个关键字结束:
error code [reason]
pipe
(3)vcl_pass函数
此函数在进入pass模式时被调用,用于将请求直接传递至后端主机,后端主机应答数据后送给客户端,但不进行任何缓存,在当前链接下每次都返回最新的内容。
此函数通常以以下几个关键字结束:
error code [reason]
pass
(4)lookup
表示在缓存里查找被请求的对象,而且根据查找的结果把控制权交给函数vcl_hit或者函数vcl_miss。
(5)vcl_hit函数
在执行lookup指令后,若是在缓存中找到请求的内容,将自动调用该函数。
此函数通常以以下几个关键字结束:
deliver:表示将找到的内容发送给客户端,并把控制权交给函数vcl_deliver。
error code [reason]
pass
(6)vcl_miss函数
在执行lookup指令后,若是没有在缓存中找到请求的内容时自动调用该方法,此函数能够用于判断是否须要从后端服务器取内容。
此函数通常以以下几个关键字结束:
fetch:表示从后端获取请求的内容,并把控制权交给vcl_fetch函数。
error code [reason]
pass
(7)vcl_fetch函数
在从后端主机更新缓存而且获取内容后调用该方法,接着,经过判断获取的内容来决定是否将内容放入缓存,仍是直接返回给客户端。
此函数通常以以下几个关键字结束:
error code [reason]
pass
deliver
(8)vcl_deliver函数
在缓存中找到请求的内容后,发送给客户端前调用此方法。此函数通常以以下几个关键字结束:
error code [reason]
deliver
(9)vcl_timeout 函数
此函数在缓存内容到期前调用。通常以以下几个关键字结束:
discard:表示从缓存中清除该内容。
fetch
(10)vcl_discard函数
在缓存内容到期后或缓存空间不够时,自动调用该方法,通常以以下几个关键字结束:
keep:表示将内容继续保留在缓存中。
discard
3、VCL和Varnish处理http请求的流程
经过上面对VCL函数的介绍,读者对各个函数实现的功能已经有了一个了解,其实每一个函数之间都是相互关联的,下图列出了varnish处理HTTP请求的一个运行流程图。
处理过程大体分为以下几个步骤:
(1) Receive状态,也就是请求处理的入口状态,根据VCL规则判断该请求应该是Pass或Pipe,或者进入Lookup(本地查询)。
(2) Lookup状态,进入此状态后,会在hash表中查找数据,若找到,则进入Hit状态,不然进入miss状态。
(3) Pass状态,在此状态下,会进入后端请求,即进入fetch状态。
(4) Fetch状态,在Fetch状态下,对请求进行后端的获取,发送请求,得到数据,并进行本地的存储。
(5) Deliver状态, 将获取到的数据发送给客户端,而后完成本次请求。
三、内置公用变量
VCL内置的公用变量能够用在不一样的VCL函数中,根据这些公用变量使用的不一样阶段,下面依次介绍。
当请求到达后,可使用的公用变量如表2所示:
表2
公用变量名称 含义
req.backend 指定对应的后端主机
server.ip 表示服务器端IP
client.ip 表示客户端IP
req.request 指定请求的类型,例如GET、HEAD、POST等
req.url 指定请求的地址
req.proto 表示客户端发起请求的HTTP协议版本
req.http.header 表示对应请求中的http头部信息
req. restarts 表示请求重启的次数,默认最大值为4
Varnish 在向后端主机请求时,可使用的公用变量如表3所示:
表3
公用变量名称 含义
beresp.request 指定请求的类型,例如GET、HEAD等
beresp.url 指定请求的地址
beresp .proto 表示客户端发起请求的HTTP协议版本
beresp .http.header 表示对应请求中的http头部信息
beresp .ttl 表示缓存的生存周期,也就是cache保留多长时间,单位是秒
从cache或者后端主机获取内容后,可使用的公用变量如表4所示:
表4
公用变量名称 含义
obj.status 表示返回内容的请求状态代码,例如200、30二、504等
obj.cacheable 表示返回的内容是否能够缓存,也就是说,若是HTTP返回是200、20三、300、30一、30二、40四、410等,而且有非0的生存期,则能够缓存
obj.valid 表示是不是有效的HTTP应答
obj.response 表示返回内容的请求状态信息
obj.proto 表示返回内容的HTTP协议版本
obj.ttl 表示返回内容的生存周期,也就是缓存时间,单位是秒
obj.lastuse 表示返回上一次请求到如今的间隔时间,单位是秒
对客户端应答时,可使用的公用变量如表5所示:
表5
公用变量名称 含义
resp.status 表示返回给客户端的HTTP状态代码
resp.proto 表示返回给客户端的HTTP协议版本
resp.http.header 表示返回给客户端的HTTP头部信息
resp.response 表示返回给客户端的HTTP状态信息
在上面的讲述中,咱们只是介绍了经常使用的VCL内置公用变量,若是须要了解和使用更多的公用变量信息,请登陆varnish官方网站查阅。
4、配置一个简单的Varnish实例
因为版本的不一样,Varnish配置文件的写法也存在必定差别,varnish2.x版本和1.x版本之间不但配置文件写法不一样,并且新的版本功能也增长不少,而且去除了不少应用BUG,这里讲述的版本是varnish2.1.2,配置文件写法也以varnish2.x版本为基准。
Varnish安装完成后,默认的配置文件为/usr/local/varnish/etc/varnish/default.vcl,此文件内容默认所有被注释掉了,这里,咱们以这个文件为模板,建立一个新的文件vcl.conf,而且放到/usr/local/varnish/etc目录下,配置完成的vcl.conf文件以下:
#经过backend定义了一个名称为webserver的后端主机,“.host”指定后端主机的IP地址或者域名,“.port”指定后端主机的服务端口。其中,“192.168.12.26”就是后端的一个web服务器。
backend webserver {
.host = "192.168.12.26";
.port = "80";
}
#调用vcl_recv开始。
sub vcl_recv {
if (req.http.x-forwarded-for) {
set req.http.X-Forwarded-For =
req.http.X-Forwarded-For ", " client.ip;
} else {
set req.http.X-Forwarded-For = client.ip;
}
#若是请求的类型不是GET、HEAD、PUT、POST、TRACE、OPTIONS、DELETE时,进入pipe模式。注意这里是“&&”的关系。
if (req.request != "GET" &&
req.request != "HEAD" &&
req.request != "PUT" &&
req.request != "POST" &&
req.request != "TRACE" &&
req.request != "OPTIONS" &&
req.request != "DELETE") {
return (pipe);
}
#若是请求的类型不是GET与HEAD,则进入pass模式。
if (req.request != "GET" && req.request != "HEAD") {
return (pass);
}
#对ixdba.net或者ixdba.cn两个域名进行缓存加速,这是个泛域名的概念,也就是全部以ixdba.net或者ixdba.cn结尾的域名都进行缓存。
if (req.http.host ~ "^(.*).ixdba.net" || req.http.host ~ "^(.*).ixdba.cn") {
set req.backend = webserver;
}
#对以.jsp和.do结尾以及带有?的URL时,直接从后端服务器读取内容。
if (req.url ~ "\.(jsp|do)($|\?)") {
return (pass);
} else {
return (lookup);
}
}
sub vcl_pipe {
return (pipe);
}
sub vcl_pass {
return (pass);
}
sub vcl_hash {
set req.hash += req.url;
if (req.http.host) {
set req.hash += req.http.host;
} else {
set req.hash += server.ip;
}
return (hash);
}
sub vcl_hit {
if (!obj.cacheable) {
return (pass);
}
return (deliver);
}
sub vcl_miss {
return (fetch);
}
sub vcl_fetch {
if (!beresp.cacheable) {
return (pass);
}
if (beresp.http.Set-Cookie) {
return (pass);
}
#当url中包含servlet时,不进行缓存。
if (req.url ~ "^/servlet/") {
return (pass);
}
#当url中包含services时,不进行缓存。
if (req.url ~ "^/services/") {
return (pass);
}
#对于请求类型是GET,而且请求的URL中包含upload,那么就进行缓存,缓存的时间是300秒,即5分钟。
if (req.request == "GET" && req.url ~ "^/upload(.*)$") {
set beresp.ttl = 300s;
}
#对于请求类型是GET,而且请求的URL以png、xsl、xml、gif、css、js等结尾时,则进行缓存,缓存时间为600秒。
if (req.request == "GET" && req.url ~ "\.(png|xsl|xml|pdf|ppt|doc|docx|chm|rar|zip|bmp|jpeg|swf|ico|mp3|mp4|rmvb|ogg|mov|avi|wmv|swf|txt|png|gif|jpg|css|js|html|htm)$") {
set beresp.ttl = 600s;
}
return (deliver);
}
#下面是添加一个Header标识,以判断缓存是否命中。
sub vcl_deliver {
if (obj.hits > 0) {
set resp.http.X-Cache = "HIT from www.ixdba.net";
} else {
set resp.http.X-Cache = "MISS from www.ixdba.net";
}
return (deliver);
}