LVS Nginx HAProxy 优缺点

搭建负载均衡高可用环境相对简单,主要是要理解其中原理。此文描述了三种负载均衡器的优缺点,以便在实际的生产应用中,按需求取舍。javascript


目前,在线上环境中应用较多的负载均衡器硬件有F5 BIG-IP,软件有LVS,Nginx及HAProxy,高可用软件有Heartbeat、Keepalived,成熟的架构有LVS+Keepalived、Nginx+Keepalived、HAProxy+keepalived及DRBD+Heartbeat.

三种负载均衡器的优缺点说明以下:

LVS的优势:
一、抗负载能力强、工做在第4层仅做分发之用,没有流量的产生,这个特色也决定了它在负载均衡软件里的性能最强的;无流量,同时保证了均衡器IO的性能不会受到大流量的影响;
二、工做稳定,自身有完整的双机热备方案,如LVS+Keepalived和LVS+Heartbeat;
三、应用范围比较广,能够对全部应用作负载均衡;
四、配置性比较低,这是一个缺点也是一个优势,由于没有可太多配置的东西,因此并不须要太多接触,大大减小了人为出错的概率;
LVS的缺点:
一、软件自己不支持正则处理,不能作动静分离,这就凸显了Nginx/HAProxy+Keepalived的优点。
二、若是网站应用比较庞大,LVS/DR+Keepalived就比较复杂了,特别是后面有Windows Server应用的机器,实施及配置还有维护过程就比较麻烦,相对而言,Nginx/HAProxy+Keepalived就简单多了。
#############################################################php

 

1. LVS/DR如何处理请求报文的,会修改IP包内容吗?css

1.1 vs/dr自己不会关心IP层以上的信息,即便是端口号也是tcp/ip协议栈去判断是否正确,vs/dr自己主要作这么几个事:html

1)接收client的请求,根据你设定的负载均衡算法选取一台realserver的ip;前端

2)以选取的这个ip对应的mac地址做为目标mac,而后从新将IP包封装成帧转发给这台RS;java

3)在hash table中记录链接信息。node

vs/dr作的事情不多,也很简单,因此它的效率很高,不比硬件负载均衡设备差多少。mysql

数据包、数据帧的大体流向是这样的:client --> VS --> RS --> clientlinux

1.2 前面已做了回答,vs/dr不会修改IP包的内容.web

2. RealServer为何要在lo接口上配置VIP?在出口网卡上配置VIP能够吗?

2.1 既然要让RS可以处理目标地址为vip的IP包,首先必需要让RS能接收到这个包。

在lo上配置vip可以完成接收包并将结果返回client。

2.2 答案是不能够将VIP设置在出口网卡上,不然会响应客户端的arp request,形成client/gateway arp table紊乱,以致于整个load balance都不能正常工做。

3. RealServer为何要抑制arp帧?

这个问题在上一问题中已经做了说明,这里结合实施命令进一步阐述。咱们在具体实施部署的时候都会做以下调整:

       echo "1" >/proc/sys/net/ipv4/conf/lo/arp_ignore
       echo "2" >/proc/sys/net/ipv4/conf/lo/arp_announce
       echo "1" >/proc/sys/net/ipv4/conf/all/arp_ignore
       echo "2" >/proc/sys/net/ipv4/conf/all/arp_announce

我相信不少人都不会弄懂它们的做用是什么,只知道必定得有。我这里也不打算拿出来详细讨论,只是做几点说明,就当是补充吧。

3.1

echo "1" >/proc/sys/net/ipv4/conf/lo/arp_ignore
echo "2" >/proc/sys/net/ipv4/conf/lo/arp_announce

这两条是能够不用的,由于arp对逻辑接口没有意义。

3.2 若是你的RS的外部网络接口是eth0,那么

echo "1" >/proc/sys/net/ipv4/conf/all/arp_ignore
echo "2" >/proc/sys/net/ipv4/conf/all/arp_announce

其实真正要执行的是:

echo "1" >/proc/sys/net/ipv4/conf/eth0/arp_ignore
echo "2" >/proc/sys/net/ipv4/conf/eth0/arp_announce

因此我我的建议把上面两条也加到你的脚本里去,由于万一系统里上面两条默认的值不是0,那有多是会出问题滴。

4. LVS/DR load balancer(director)与RS为何要在同一网段中?

从第一个问题中你们应该明白vs/dr是如何将请求转发给RS的了吧?它是在数据链路层来实现的,因此director必须和RS在同一网段里面。

5. 为何director上lo接口除了VIP另外还要在eth0配一个ip(即DIP)?

5.1 若是是用了keepalived等工具作HA或者Load Balance,则在健康检查时须要用到DIP。

5.2 没有健康检查机制的HA或者Load Balance则没有存在的实际意义。

6. LVS/DR ip_forward须要开启吗?

不须要。由于director跟realserver是同一个网段,无需开启转发。

7. director的vip的netmask必定要是255.255.255.255吗?

lvs/dr里,director的vip的netmask 不必设置为255.255.255.255,也不须要再去

route add -host $VIP dev eth0:0

director的vip原本就是要像正常的ip地址同样对外通告的,不要搞得这么特殊.

8. LVS/DR如何进行tcp的三次握手?

 

#####################################################################

 


Nginx的优势:
一、工做在OSI第7层,能够针对http应用作一些分流的策略。好比针对域名、目录结构。它的正则比HAProxy更为强大和灵活;
二、Nginx对网络的依赖很是小,理论上能ping通就就能进行负载功能,这个也是它的优点所在;
三、Nginx安装和配置比较简单,测试起来比较方便;
四、能够承担高的负载压力且稳定,通常能支撑超过几万次的并发量;
五、Nginx能够经过端口检测到服务器内部的故障,好比根据服务器处理网页返回的状态码、超时等等,而且会把返回错误的请求从新提交到另外一个节点;
六、Nginx不只仅是一款优秀的负载均衡器/反向代理软件,它同时也是功能强大的Web应用服务器。LNMP如今也是很是流行的web环境,大有和LAMP环境平起平坐之势,Nginx在处理静态页面、特别是抗高并发方面相对apache有优点;
七、Nginx如今做为Web反向加速缓存愈来愈成熟了,速度比传统的Squid服务器更快,有需求的朋友能够考虑用其做为反向代理加速器;
Nginx的缺点:
一、Nginx不支持url来检测。
二、Nginx仅能支持http和Email,这个它的弱势。
三、Nginx的Session的保持,Cookie的引导能力相对欠缺。

HAProxy的优势:
一、HAProxy是支持虚拟主机的,能够工做在四、7层(支持多网段);
二、可以补充Nginx的一些缺点好比Session的保持,Cookie的引导等工做;
三、支持url检测后端的服务器;
四、它跟LVS同样,自己仅仅就只是一款负载均衡软件;单纯从效率上来说HAProxy更会比Nginx有更出色的负载均衡速度,在并发处理上也是优于Nginx的;
五、HAProxy能够对Mysql读进行负载均衡,对后端的MySQL节点进行检测和负载均衡,不过在后端的MySQL slaves数量超过10台时性能不如LVS;
六、HAProxy的算法较多,达到8种;

 

 

原文:http://www.ttlsa.com/linux/haproxy-study-tutorial/

1、HAProxy简介

(1)HAProxy 是一款提供高可用性、负载均衡以及基于TCP(第四层)和HTTP(第七层)应用的代理软件,支持虚拟主机,它是免费、快速而且可靠的一种解决方案。 HAProxy特别适用于那些负载特大的web站点,这些站点一般又须要会话保持或七层处理。HAProxy运行在时下的硬件上,彻底能够支持数以万计的 并发链接。而且它的运行模式使得它能够很简单安全的整合进您当前的架构中, 同时能够保护你的web服务器不被暴露到网络上。

(2)HAProxy 实现了一种事件驱动、单一进程模型,此模型支持很是大的并发链接数。多进程或多线程模型受内存限制 、系统调度器限制以及无处不在的锁限制,不多能处理数千并发链接。事件驱动模型由于在有更好的资源和时间管理的用户端(User-Space) 实现全部这些任务,因此没有这些问题。此模型的弊端是,在多核系统上,这些程序一般扩展性较差。这就是为何他们必须进行优化以 使每一个CPU时间片(Cycle)作更多的工做。

(3)HAProxy 支持链接拒绝 : 由于维护一个链接的打开的开销是很低的,有时咱们很须要限制攻击蠕虫(attack bots),也就是说限制它们的链接打开从而限制它们的危害。 这个已经为一个陷于小型DDoS攻击的网站开发了并且已经拯救

了不少站点,这个优势也是其它负载均衡器没有的。

(4)HAProxy 支持全透明代理(已具有硬件防火墙的典型特色): 能够用客户端IP地址或者任何其余地址来链接后端服务器. 这个特性仅在Linux 2.4/2.6内核打了cttproxy补丁后才可使用. 这个特性也使得为某特殊服务器处理部分流量同时又不修改服务器的地址成为可能。

性能

HAProxy借助于OS上几种常见的技术来实现性能的最大化。

1,单进程、事件驱动模型显著下降了上下文切换的开销及内存占用。

2,O(1)事件检查器(event checker)容许其在高并发链接中对任何链接的任何事件实现即时探测。

3,在任何可用的状况下,单缓冲(single buffering)机制能以不复制任何数据的方式完成读写操做,这会节约大量的CPU时钟周期及内存带宽;

4,借助于Linux 2.6 (>= 2.6.27.19)上的splice()系统调用,HAProxy能够实现零复制转发(Zero-copy forwarding),在Linux 3.5及以上的OS中还能够实现零复制启动(zero-starting);

5,内存分配器在固定大小的内存池中可实现即时内存分配,这可以显著减小建立一个会话的时长;

6,树型存储:侧重于使用做者多年前开发的弹性二叉树,实现了以O(log(N))的低开销来保持计时器命令、保持运行队列命令及管理轮询及最少链接队列;

7,优化的HTTP首部分析:优化的首部分析功能避免了在HTTP首部分析过程当中重读任何内存区域;

8,精心地下降了昂贵的系统调用,大部分工做都在用户空间完成,如时间读取、缓冲聚合及文件描述符的启用和禁用等;

全部的这些细微之处的优化实现了在中等规模负载之上依然有着至关低的CPU负载,甚至于在很是高的负载场景中,5%的用户空间占用率和95%的系统空间占用率也是很是广泛的现象,这意味着HAProxy进程消耗比系统空间消耗低20倍以上。所以,对OS进行性能调优是很是重要的。即便用户空间的占用率提升一倍,其CPU占用率也仅为10%,这也解释了为什么7层处理对性能影响有限这一现象。由此,在高端系统上HAProxy的7层性能可轻易超过硬件负载均衡设备。

在生产环境中,在7层处理上使用HAProxy做为昂贵的高端硬件负载均衡设备故障故障时的紧急解决方案也时长可见。硬件负载均衡设备在“报文”级别处理请求,这在支持跨报文请求(request across multiple packets)有着较高的难度,而且它们不缓冲任何数据,所以有着较长的响应时间。对应地,软件负载均衡设备使用TCP缓冲,可创建极长的请求,且有着较大的响应时间。

HAProxy目前主要有三个版本: 1.3 , 1.4 ,1.5,CentOS6.6 自带的RPM包为 1.5 的。

二,安装配置HAProxy

如下实验环境均为CentOS6.6 i686平台。

1,安装haproxy

 

 

2,详解配置文件

haproxy 的配置文件由两部分组成:全局设定和对代理的设定,共分为五段:global,defaults,frontend,backend,listen。

2.1 配置文件格式

HAProxy的配置处理3类来主要参数来源:

——最优先处理的命令行参数;

——“global”配置段,用于设定全局配置参数;

——proxy相关配置段,如“defaults”、“listen”、“frontend”和“backend”;

2.2 时间格式

一些包含了值的参数表示时间,如超时时长。这些值通常以毫秒为单位,但也可使用其它的时间单位后缀。

 

2.3 全局配置

* 进程管理及安全相关的参数

– chroot <jail dir>:修改haproxy的工做目录至指定的目录并在放弃权限以前执行chroot()操做,能够提高haproxy的安全级别,不过须要注意的是要确保指定的目录为空目录且任何用户均不能有写权限;

– daemon:让haproxy以守护进程的方式工做于后台,其等同于“-D”选项的功能,固然,也能够在命令行中以“-db”选项将其禁用;

– gid <number>:以指定的GID运行haproxy,建议使用专用于运行haproxy的GID,以避免因权限问题带来风险;

– group <group name>:同gid,不过指定的组名;

– log <address> <facility> [max level [min level]]:定义全局的syslog服务器,最多能够定义两个;

– log-send-hostname [<string>]:在syslog信息的首部添加当前主机名,能够为“string”指定的名称,也能够缺省使用当前主机名;

– nbproc <number>:指定启动的haproxy进程的个数,只能用于守护进程模式的haproxy;默认只启动一个进程,鉴于调试困难等多方面的缘由,通常只在单进程仅能打开少数文件描述符的场景中才使用多进程模式;

– pidfile:

– uid:以指定的UID身份运行haproxy进程;

– ulimit-n:设定每进程所可以打开的最大文件描述符数目,默认状况下其会自动进行计算,所以不推荐修改此选项;Linux默认单进程打开文件数为1024个

– user:同uid,但使用的是用户名;

– stats:用户访问统计数据的接口

– node:定义当前节点的名称,用于HA场景中多haproxy进程共享同一个IP地址时;

– description:当前实例的描述信息;

 

* 性能调整相关的参数

– maxconn <number>:设定每一个haproxy进程所接受的最大并发链接数,其等同于命令行选项“-n”;“ulimit -n”自动计算的结果正是参照此参数设定的;

– maxpipes <number>:haproxy使用pipe完成基于内核的tcp报文重组,此选项则用于设定每进程所容许使用的最大pipe个数;每一个pipe会打开两个文件描述符,所以,“ulimit -n”自动计算时会根据须要调大此值;默认为maxconn/4,其一般会显得过大;

– noepoll:在Linux系统上禁用epoll机制;

– nokqueue:在BSE系统上禁用kqueue机制;

– nopoll:禁用poll机制;

– nosepoll:在Linux禁用启发式epoll机制;

– nosplice:禁止在Linux套接字上使用内核tcp重组,这会致使更多的recv/send系统调用;不过,在Linux 2.6.25-28系列的内核上,tcp重组功能有bug存在;

– spread-checks <0..50, in percent>:在haproxy后端有着众多服务器的场景中,在精确的时间间隔后统一对众服务器进行健康情况检查可能会带来意外问题;此选项用于将其检查的时间间隔长度上增长或减少必定的随机时长;

– tune.bufsize <number>:设定buffer的大小,一样的内存条件小,较小的值可让haproxy有能力接受更多的并发链接,较大的值可让某些应用程序使用较大的cookie信息;默认为16384,其能够在编译时修改,不过强烈建议使用默认值;

– tune.chksize <number>:设定检查缓冲区的大小,单位为字节;更大的值有助于在较大的页面中完成基于字符串或模式的文本查找,但也会占用更多的系统资源;不建议修改;

– tune.maxaccept <number>:设定haproxy进程内核调度运行时一次性能够接受的链接的个数,较大的值能够带来较大的吞吐率,默认在单进程模式下为100,多进程模式下为8,设定为-1能够禁止此限制;通常不建议修改;

– tune.maxpollevents <number>:设定一次系统调用能够处理的事件最大数,默认值取决于OS;其值小于200时可节约带宽,但会略微增大网络延迟,而大于200时会下降延迟,但会稍稍增长网络带宽的占用量;

– tune.maxrewrite <number>:设定为首部重写或追加而预留的缓冲空间,建议使用1024左右的大小;在须要使用更大的空间时,haproxy会自动增长其值;

– tune.rcvbuf.client <number>:

– tune.rcvbuf.server <number>:设定内核套接字中服务端或客户端接收缓冲的大小,单位为字节;强烈推荐使用默认值;

– tune.sndbuf.client:

– tune.sndbuf.server:

 

* Debug相关的参数

* 超时时长

* 实现访问控制:

 

2.4 代理

代理相关的配置能够以下配置段中。

“defaults”段用于为全部其它配置段提供默认参数,这配置默认配置参数可由下一个“defaults”所从新设定。
“frontend”段用于定义一系列监听的套接字,这些套接字可接受客户端请求并与之创建链接。
“backend”段用于定义一系列“后端”服务器,代理将会将对应客户端的请求转发至这些服务器。
“listen”段经过关联“frontend”和“backend”定义了一个完整的代理,一般只对TCP流量有用。

全部代理的名称只能使用大写字母、小写字母、数字、-(中线)、_(下划线)、.(点号)和:(冒号)。此外,ACL名称会区分字母大小写。

3、配置文件中的关键字参考

3.1 balance

 

定义负载均衡算法,可用于“defaults”、“listen”和“backend”。用于在负载均衡场景中挑选一个server,其仅应用于持久信息不可用的条件下或须要将一个链接从新派发至另外一个服务器时。支持的算法有:

3.11 roundrobin:基于权重进行轮叫,在服务器的处理时间保持均匀分布时,这是最平衡、最公平的算法。此算法是动态的,这表示其权重能够在运行时进行调整,不过,在设计上,每一个后端服务器仅能最多接受4128个链接;并支持慢启动。

3.12 static-rr:基于权重进行轮叫,与roundrobin相似,可是为静态方法,在运行时调整其服务器权重不会生效;不过,其在后端服务器链接数上没有限制;不支持慢启动,在高负荷的状况下,服务器从新上线时会当即被分配大量链接。

3.13 leastconn(WLC):适用于长链接的会话,新的链接请求被派发至具备最少链接数目的后端服务器;在有着较长时间会话的场景中推荐使用此算法,如LDAP、SQL等,其并不太适用于较短会话的应用层协议,如HTTP;此算法是动态的,

能够在运行时调整其权重;

3.14 source:将请求的源地址进行hash运算,并由后端服务器的权重总数相除后派发至某匹配的服务器;这可使得同一个客户端IP的请求始终被派发至某特定的服务器;不过,当服务器权重总数发生变化时,如某服务器宕机或添加了新的服务器,许多客户端的请求可能会被派发至与此前请求不一样的服务器;经常使用于负载均衡无cookie功能的基于TCP的协议;其默认为静态,不过也可使用hash-type修改此特性;

1,对原地址hash,第一次调度时使用WLC
source:IP层,位于同一个NAT服务器背后的多个请求都会定向至同一个upstream server,不利于负载均衡,通常只有不支持使用cookie插入又须要保持会话时使用
cookie:应用层,有更好的负载均衡效果;

2,hash/weight%ip :除以权重取模

3.15 uri:对URI的左半部分(“问题”标记以前的部分)或整个URI进行hash运算,并由服务器的总权重相除后派发至某匹配的服务器;这可使得对同一个URI的请求老是被派发至某特定的服务器,除非服务器的权重总数发生了变化;此算法经常使用于代理缓存或反病毒代理以提升缓存的命中率;须要注意的是,此算法仅应用于HTTP后端服务器场景;其默认为静态算法,不过也可使用hash-type修改此特性;

3.16 url_param:经过<argument>为URL指定的参数在每一个HTTP GET请求中将会被检索;若是找到了指定的参数且其经过等于号“=”被赋予了一个值,那么此值将被执行hash运算并被服务器的总权重相除后派发至某匹配的服务器;此算法能够经过追踪请求中的用户标识进而确保同一个用户ID的请求将被送往同一个特定的服务器,除非服务器的总权重发生了变化;若是某请求中没有出现指定的参数或其没有有效值,则使用轮叫算法对相应请求进行调度;此算法默认为静态的,不过其也可使用hash-type修改此特性;

3.17 hdr(<name>):对于每一个HTTP请求,经过<name>指定的HTTP首部将会被检索;若是相应的首部没有出现或其没有有效值,则使用轮叫算法对相应请求进行调度;其有一个可选选项“use_domain_only”,可在指定检索相似Host类的首部时仅计算域名部分(好比经过www.feiyu.com来讲,仅计算feiyu字符串的hash值)以下降hash算法的运算量;此算法默认为静态的,不过其也可使用hash-type修改此特性;

3.18 rdp-cookie(name)

,表示根据据cookie(name)来锁定并哈希每一次TCP请求。

3.2 bind

 

此指令仅能用于frontend和listen区段,用于定义一个或几个监听的套接字。

<address>:可选选项,其能够为主机名、IPv4地址、IPv6地址或*;省略此选项、将其指定为*或0.0.0.0时,将监听当前系统的全部IPv4地址;<port_range>:能够是一个特定的TCP端口,也但是一个端口范围(如5005-5010),代理服务器将经过指定的端口来接收客户端请求;须要注意的是,每组监听的套接字<address:port>在同一个实例上只能使用一次,并且小于1024的端口须要有特定权限的用户才能使用,这可能须要经过uid参数来定义;<interface>:指定物理接口的名称,仅能在Linux系统上使用;其不能使用接口别名,而仅能使用物理接口名称,并且只有管理有权限指定绑定的物理接口;

3.3 mode

 

设定实例的运行模式或协议。当实现内容交换时,前端和后端必须工做于同一种模式(通常说来都是HTTP模式),不然将没法启动实例。

tcp:实例运行于纯TCP模式,在客户端和服务器端之间将创建一个全双工的链接,且不会对7层报文作任何类型的检查;一般用于SSL、SSH、SMTP等应用;
http:实例运行于HTTP模式,客户端请求在转发至后端服务器以前将被深度分析,全部不与RFC格式兼容的请求都会被拒绝;此为默认模式;
health:实例工做于health模式,其对入站请求仅响应“OK”信息并关闭链接,且不会记录任何日志信息;此模式将用于响应外部组件的健康状态检查请求;目前来说,此模式已经废弃,由于tcp或http模式中的monitor关键字可完成相似功能;

 

3.4 hash-type

 

定义用于将hash码映射至后端服务器的方法;其不能用于frontend区段;可用方法有map-based和consistent,在大多数场景下推荐使用默认的map-based方法。

map-based:hash表是一个包含了全部在线服务器的静态数组。其hash值将会很是平滑,会将权重考虑在列,但其为静态方法,对在线服务器的权重进行调整将不会生效,这意味着其不支持慢速启动。此外,挑选服务器是根据其在数组中的

位置进行的,所以,当一台服务器宕机或添加了一台新的服务器时,大多数链接将会被从新派发至一个与此前不一样的服务器上,对于缓存服务器的工做场景来讲,此方法不甚适用。

consistent:“一致性哈希算法”,hash表是一个由各服务器填充而成的树状结构,将服务器散列在hash环上;基于hash键在hash树中查找相应的服务器时,最近的服务器将被选中。此方法是动态的,支持在运行时修改服务器权重,所以兼

容慢速启动的特性。添加一个新的服务器时,仅会对一小部分请求产生影响,所以,尤为适用于后端服务器为cache的场景。不过,此算法不甚平滑,派发至各服务器的请求未必能达到理想的均衡效果,所以,可能须要不时的调整服务器的权

重以得到更好的均衡性。

 

3.5 log

 

为每一个实例启用事件和流量日志,所以可用于全部区段。每一个实例最多能够指定两个log参数,不过,若是使用了“log global”且”global”段已经定了两个log参数时,多余了log参数将被忽略。

global:当前实例的日志系统参数同”global”段中的定义时,将使用此格式;每一个实例仅能定义一次“log global”语句,且其没有任何额外参数;

<address>:定义日志发往的位置,其格式之一能够为<IPv4_address:PORT>,其中的port为UDP协议端口,默认为514;格式之二为Unix套接字文件路径,但须要留心chroot应用及用户的读写权限;

<facility>:能够为syslog系统的标准facility之一;

<level>:定义日志级别,即输出信息过滤器,默认为全部信息;指定级别时,全部等于或高于此级别的日志信息将会被发送;

 

3.6 maxconn

 

设定一个前端的最大并发链接数,所以,其不能用于backend区段。对于大型站点来讲,能够尽量提升此值以便让haproxy管理链接队列,从而避免没法应答用户请求。固然,此最大值不能超出“global”段中的定义。此外,须要留心的是,haproxy会为每一个链接维持两个缓冲,每一个缓冲的大小为8KB,再加上其它的数据,每一个链接将大约占用17KB的RAM空间。这意味着通过适当优化后,有着1GB的可用RAM空间时将能维护40000-50000并发链接。

若是为<conns>指定了一个过大值,极端场景下,其最终占据的空间可能会超出当前主机的可用内存,这可能会带来意想不到的结果;所以,将其设定了一个可接受值方为明智决定。其默认为2000。

3.7 default_backend

 

在没有匹配的”use_backend”规则时为实例指定使用的默认后端,所以,其不可应用于backend区段。在”frontend”和”backend”之间进行内容交换时,一般使用”use-backend”定义其匹配规则;而没有被规则匹配到的请求将由此参数指定的后端接收。

<backend>:指定使用的后端的名称;

使用案例:

 

3.8 server

 

为后端声明一个server,所以,不能用于defaults和frontend区段。

<name>:为此服务器指定的内部名称,其将出如今日志及警告信息中;若是设定了”http-send-server-name”,它还将被添加至发往此服务器的请求首部中;

<address>:此服务器的的IPv4地址,也支持使用可解析的主机名,只不过在启动时须要解析主机名至相应的IPv4地址;

[:port]:指定将链接请求所发往的此服务器时的目标端口,其为可选项;未设定时,将使用客户端请求时的同一相端口;

[param*]:为此服务器设定的一系参数;其可用的参数很是多,具体请参考官方文档中的说明,下面仅说明几个经常使用的参数;

服务器或默认服务器参数:

backup:设定为备用服务器,仅在负载均衡场景中的其它server均不可用于启用此server;

check:启动对此server执行健康状态检查,其能够借助于额外的其它参数完成更精细的设定,如:

inter <delay>:设定健康状态检查的时间间隔,单位为毫秒,默认为2000;也可使用fastinter和downinter来根据服务器端状态优化此时间延迟;

rise <count>:设定健康状态检查中,某离线的server从离线状态转换至正常状态须要成功检查的次数;

fall <count>:确认server从正常状态转换为不可用状态须要检查的次数;

cookie <value>:为指定server设定cookie值,此处指定的值将在请求入站时被检查,第一次为此值挑选的server将在后续的请求中被选中,其目的在于实现持久链接的功能;

maxconn <maxconn>:指定此服务器接受的最大并发链接数;若是发往此服务器的链接数目高于此处指定的值,其将被放置于请求队列,以等待其它链接被释放;

haproxy 有n个进程,每一个支持m个链接,后端有x个服务器,每一个最大支持y个链接,则 n*m <= x*y,若是后端服务器支持排队,则n*m <= x*(y+z),z为每一个服务器的排队队列

maxqueue <maxqueue>:设定请求队列的最大长度;

observe <mode>:经过观察服务器的通讯情况来断定其健康状态,默认为禁用,其支持的类型有“layer4”和“layer7”,“layer7”仅能用于http代理场景;

redir <prefix>:启用重定向功能,将发往此服务器的GET和HEAD请求均以302状态码响应;须要注意的是,在prefix后面不能使用/,且不能使用相对地址,以避免形成循环;例如:

weight <weight>:权重,默认为1,最大值为256,0表示不参与负载均衡(不被调度);

检查方法:

使用案例:

 

3.9 capture request header

 

捕获并记录指定的请求首部最近一次出现时的第一个值,仅能用于“frontend”和“listen”区段。捕获的首部值使用花括号{}括起来后添加进日志中。若是须要捕获多个首部值,它们将以指定的次序出如今日志文件中,并以竖线“|”做为分隔符。不存在的首部记录为空字符串,最常须要捕获的首部包括在虚拟主机环境中使用的“Host”、上传请求首部中的“Content-length”、快速区别真实用户和网络机器人的“User-agent”,以及代理环境中记录真实请求来源的“X-Forward-For”。

<name>:要捕获的首部的名称,此名称不区分字符大小写,但建议与它们出如今首部中的格式相同,好比大写首字母。须要注意的是,记录在日志中的是首部对应的值,而非首部名称。

<length>:指定记录首部值时所记录的精确长度,超出的部分将会被忽略。

能够捕获的请求首部的个数没有限制,但每一个捕获最多只能记录64个字符。为了保证同一个frontend中日志格式的统一性,首部捕获仅能在frontend中定义。

 

3.10 capture response header

 

捕获并记录响应首部,其格式和要点同请求首部。

 

3.11 stats enable

启用基于程序编译时默认设置的统计报告,不能用于“frontend”区段。只要没有另外的其它设定,它们就会使用以下的配置:

尽管“stats enable”一条就可以启用统计报告,但仍是建议设定其它全部的参数,以避免其依赖于默认设定而带来非期后果。下面是一个配置案例。

 

3.12 stats hide-version

 

启用统计报告并隐藏HAProxy版本报告,不能用于“frontend”区段。默认状况下,统计页面会显示一些有用信息,包括HAProxy的版本号,然而,向全部人公开HAProxy的精确版本号是很是有风险的,由于它能帮助恶意用户快速定位版本的缺陷和漏洞。尽管“stats hide-version”一条就可以启用统计报告,但仍是建议设定其它全部的参数,以避免其依赖于默认设定而带来非期后果。具体请参照“stats enable”一节的说明。

3.13 stats realm

 

启用统计报告并高精认证领域,不能用于“frontend”区段。haproxy在读取realm时会将其视做一个单词,所以,中间的任何空白字符都必须使用反斜线进行转义。此参数仅在与“stats auth”配置使用时有意义。

<realm>:实现HTTP基本认证时显示在浏览器中的领域名称,用于提示用户输入一个用户名和密码。

尽管“stats realm”一条就可以启用统计报告,但仍是建议设定其它全部的参数,以避免其依赖于默认设定而带来非期后果。具体请参照“stats enable”一节的说明。

3.14 stats scope

 

启用统计报告并限定报告的区段,不能用于“frontend”区段。当指定此语句时,统计报告将仅显示其列举出区段的报告信息,全部其它区段的信息将被隐藏。若是须要显示多个区段的统计报告,此语句能够定义屡次。须要注意的是,区段名称检测仅仅是以字符串比较的方式进行,它不会真检测指定的区段是否真正存在。

<name>:能够是一个“listen”、“frontend”或“backend”区段的名称,而“.”则表示stats scope语句所定义的当前区段。

尽管“stats scope”一条就可以启用统计报告,但仍是建议设定其它全部的参数,以避免其依赖于默认设定而带来非期后果。下面是一个配置案例。

 

3.15 stats auth

 

启用带认证的统计报告功能并受权一个用户账号,其不能用于“frontend”区段。

<user>:受权进行访问的用户名;

<passwd>:此用户的访问密码,明文格式;

此语句将基于默认设定启用统计报告功能,并仅容许其定义的用户访问,其也能够定义屡次以受权多个用户账号。能够结合“stats realm”参数在提示用户认证时给出一个领域说明信息。在使用非法用户访问统计功能时,其将会响应一个“401 Forbidden”页面。其认证方式为HTTP Basic认证,密码传输会以明文方式进行,所以,配置文件中也使用明文方式存储以说明其非保密信息故此不能相同于其它关键性账号的密码。

尽管“stats auth”一条就可以启用统计报告,但仍是建议设定其它全部的参数,以避免其依赖于默认设定而带来非期后果。

3.16 stats admin

 

在指定的条件知足时启用统计报告页面的管理级别功能,它容许经过web接口启用或禁用服务器,不过,基于安全的角度考虑,统计报告页面应该尽量为只读的。此外,若是启用了HAProxy的多进程模式,启用此管理级别将有可能致使异常行为。

目前来讲,POST请求方法被限制于仅能使用缓冲区减去保留部分以外的空间,所以,服务器列表不能过长,不然,此请求将没法正常工做。所以,建议一次仅调整少数几个服务器。下面是两个案例,第一个限制了仅能在本机打开报告页面时启用管理级别功能,第二个定义了仅容许经过认证的用户使用管理级别功能。

 

3.17 option httplog

 

启用记录HTTP请求、会话状态和计时器的功能。

clf:使用CLF格式来代替HAProxy默认的HTTP格式,一般在使用仅支持CLF格式的特定日志分析器时才须要使用此格式。

默认状况下,日志输入格式很是简陋,由于其仅包括源地址、目标地址和实例名称,而“option httplog”参数将会使得日志格式变得丰富许多,其一般包括但不限于HTTP请求、链接计时器、会话状态、链接数、捕获的首部及cookie、“frontend”、“backend”及服务器名称,固然也包括源地址和端口号等。

3.18 option logasap

 

启用或禁用提早将HTTP请求记入日志,不能用于“backend”区段。

默认状况下,HTTP请求是在请求结束时进行记录以便能将其总体传输时长和字节数记入日志,由此,传较大的对象时,其记入日志的时长可能会略有延迟。“option logasap”参数可以在服务器发送complete首部时即时记录日志,只不过,此时将不记录总体传输时长和字节数。此情形下,捕获“Content-Length”响应首部来记录传输的字节数是一个较好选择。下面是一个例子。

 

3.19 option forwardfor

 

容许在发往服务器的请求首部中插入“X-Forwarded-For”首部。

<network>:可选参数,当指定时,源地址为匹配至此网络中的请求都禁用此功能。

<name>:可选参数,可以使用一个自定义的首部,如“X-Client”来替代“X-Forwarded-For”。有些独特的web服务器的确须要用于一个独特的首部。

if-none:仅在此首部不存在时才将其添加至请求报文问道中。

HAProxy工做于反向代理模式,其发往服务器的请求中的客户端IP均为HAProxy主机的地址而非真正客户端的地址,这会使得服务器端的日志信息记录不了真正的请求来源,“X-Forwarded-For”首部则可用于解决此问题。HAProxy能够向每一个发往服务器的请求上添加此首部,并以客户端IP为其value。

须要注意的是,HAProxy工做于隧道模式,其仅检查每个链接的第一个请求,所以,仅第一个请求报文被附加此首部。若是想为每个请求都附加此首部,请确保同时使用了“option httpclose”、“option forceclose”和“option http-server-close”几个option。

下面是一个例子。

 

3.20 errorfile

 

在用户请求不存在的页面时,返回一个页面文件给客户端而非由haproxy生成的错误代码;可用于全部段中。

<code>:指定对HTTP的哪些状态码返回指定的页面;这里可用的状态码有200、400、40三、40八、500、50二、503和504;

<file>:指定用于响应的页面文件;

例如:

 

3.21 errorloc 和 errorloc302

 

请求错误时,返回一个HTTP重定向至某URL的信息;可用于全部配置段中。

<code>:指定对HTTP的哪些状态码返回指定的页面;这里可用的状态码有200、400、40三、40八、500、50二、503和504;

<url>:Location首部中指定的页面位置的具体路径,能够是在当前服务器上的页面的相对路径,也可使用绝对路径;须要注意的是,若是URI自身错误时产生某特定状态码信息的话,有可能会致使循环定向;

须要留意的是,这两个关键字都会返回302状态吗,这将使得客户端使用一样的HTTP方法获取指定的URL,对于非GET法的场景(如POST)来讲会产生问题,由于返回客户的URL是不容许使用GET之外的其它方法的。若是的确有这种问题,可使用errorloc303来返回303状态码给客户端。

3.22 errorloc303

 

请求错误时,返回一个HTTP重定向至某URL的信息给客户端;可用于全部配置段中。

<code>:指定对HTTP的哪些状态码返回指定的页面;这里可用的状态码有400、40三、40八、500、50二、503和504;

<url>:Location首部中指定的页面位置的具体路径,能够是在当前服务器上的页面的相对路径,也可使用绝对路径;须要注意的是,若是URI自身错误时产生某特定状态码信息的话,有可能会致使循环定向;

例如:

 

4、ACL

haproxy的ACL用于实现基于请求报文的首部、响应报文的内容或其它的环境状态信息来作出转发决策,这大大加强了其配置弹性。其配置法则一般分为两步,首先去定义ACL,即定义一个测试条件,然后在条件获得知足时执行某特定的动做,如阻止请求或转发至某特定的后端。定义ACL的语法格式以下。

<aclname>:ACL名称,区分字符大小写,且其只能包含大小写字母、数字、-(链接线)、_(下划线)、.(点号)和:(冒号);haproxy中,acl能够重名,这能够把多个测试条件定义为一个共同的acl;

<criterion>:测试标准,即对什么信息发起测试;测试方式能够由[flags]指定的标志进行调整;而有些测试标准也能够须要为其在以前指定一个操做符[operator];

[flags]:目前haproxy的acl支持的标志位有3个:

-i:不区分中模式字符的大小写;

-f:从指定的文件中加载模式;

--:标志符的强制结束标记,在模式中的字符串像标记符时使用;

<value>:acl测试条件支持的值有如下四类:

整数或整数范围:如1024:65535表示从1024至65535;仅支持使用正整数(若是出现相似小数的标识,其为一般为版本测试),且支持使用的操做符有5个,分别为eq、ge、gt、le和lt;

字符串:支持使用“-i”以忽略字符大小写,支持使用“\”进行转义;若是在模式首部出现了-i,能够在其以前使用“–”标志位;

正则表达式:其机制类同字符串匹配;

IP地址及网络地址;

同一个acl中能够指定多个测试条件,这些测试条件须要由逻辑操做符指定其关系。条件间的组合测试关系有三种:“与”(默认即为与操做)、“或”(使用“||”操做符)以及“非”(使用“!”操做符)。

5.1 经常使用的测试标准(criteria)

5.1.1 be_sess_rate

用于测试指定的backend上会话建立的速率(即每秒建立的会话数)是否知足指定的条件;经常使用于在指定backend上的会话速率太高时将用户请求转发至另外的backend,或用于阻止攻击行为。例如:

5.1.2 fe_sess_rate

用于测试指定的frontend(或当前frontend)上的会话建立速率是否知足指定的条件;经常使用于为frontend指定一个合理的会话建立速率的上限以防止服务被滥用。例以下面的例子限定入站邮件速率不能大于50封/秒,全部在此指定范围以外的请求都将被延时50毫秒。

5.1.3 hdr <string>

用于测试请求报文中的全部首部或指定首部是否知足指定的条件;指定首部时,其名称不区分大小写,且在括号“()”中不能有任何多余的空白字符。测试服务器端的响应报文时可使用shdr()。例以下面的例子用于测试首部Connection的值是否为close。

5.1.4 method <string>

测试HTTP请求报文中使用的方法。

5.1.5 path_beg <string>

用于测试请求的URL是否以指定的模式开头。下面的例子用于测试URL是否以/static、/images、/javascript或/stylesheets头。

5.1.6 path_end <string>

用于测试请求的URL是否以<string>指定的模式结尾。例如,下面的例子用户测试URL是否以jpg、gif、png、css或js结尾。

5.1.7 hdr_beg <string>

用于测试请求报文的指定首部的开头部分是否符合<string>指定的模式。例如,下面的例子用记测试请求是否为提供静态内容的主机img、video、download或ftp。

5.1.8 hdr_end <string>

用于测试请求报文的指定首部的结尾部分是否符合<string>指定的模式。

5、配置案例

前端调度器IP:192.168.1.210
后端应用服务器IP: 192.168.1.111 和 192.168.1.112

定义独立日志文件

 

 

一个最简单的http服务的配置

 

 

haproxy统计页面的输出机制

 

 

动静分离示例:

 

 

http服务器配置完整示例

 

 

负载均衡MySQL服务的配置示例

 

 
 http://blog.csdn.net/gsying1474/article/details/49179533
相关文章
相关标签/搜索