haproxy 初识

时间 2019-11-17

原文原文链接

官方网站：http://www.haproxy.org

描述

HAProxy的是一个免费的，很是快速和可靠的解决方案，提供高可用性，负载均衡和代理对TCP和基于HTTP的应用程序。它特别适用于流量很是高的网站，并为世界上访问量最大的网站提供支持。多年来，它已成为事实上的标准开源负载均衡器，如今随大多数主流Linux发行版一块儿提供，而且一般默认部署在云平台中。
javascript

它的操做模式使其与现有体系结构的集成很是容易且无风险，利于快速部署，同时仍然提供了不将脆弱的Web服务器暴露给网络的可能性，以下所示：css

HAProxy涉及操做系统体系结构中常见的几种技术，以实现绝对最大性能：html

单进程，事件驱动模型大大下降了上下文切换和内存使用的成本。能够在一毫秒内处理数百个任务，而且每一个会话的内存使用量大约为几千字节，而在preforked或线程服务器中消耗的内存更多的是每一个进程的兆字节数量级。
容许它的系统上的O（1）事件检查器（Linux和FreeBSD）容许在成千上万的任何链接上即时检测任何事件。
使用延迟事件缓存对事件检查器的延迟更新可确保咱们永远不会更新事件，除非绝对须要。这节省了大量的系统调用。
单缓冲，尽量在读取和写入之间不进行任何数据复制。这节省了大量CPU周期和有用的内存带宽。一般，瓶颈将是CPU和网络接口之间的I / O总线。在10-100 Gbps时，内存带宽也可能成为瓶颈。
使用Linux下的splice（）系统调用能够进行零拷贝转发，从而实现从Linux 3.5开始的真正零拷贝。这容许一个小于3瓦的设备（如Seagate Dockstar）以1千兆位/秒的速度转发HTTP流量。
MRU 内存分配器使用固定大小的内存池进行即时内存分配，有利于热缓存区域而不是冷缓存区域。这大大减小了建立新会话所需的时间。
工做因子，例如一次多个accept（），以及在多进程模式下运行时限制每次迭代的accept（）数量的能力，以便在进程之间均匀分配负载。
在多进程模式下运行时支持CPU亲和性，或者只是为了适应硬件，而且尽量与管理NIC的CPU核心最接近，而不与之冲突。
基于树的存储，大量使用弹性二叉树，我已经开发了好几年了。这用于保持定时器的顺序，以保持命令的运行队列，管理循环和最少conn队列，在表中查找ACL或密钥，只须要O（log（N））成本。
优化的计时器队列：若是推迟计时器，它们不会在树中移动，由于它们被知足的可能性接近于零，由于它们主要用于超时处理。这进一步优化了ebtree的使用。
优化的HTTP标头分析：标头被解析为动态解释，而且优化解析以免从新读取任何先前读取的存储区域。当使用不完整的头到达缓冲区的末尾时使用检查点，这样当读取更多数据时，解析不会从头开始。在快速Xeon E5上解析平均HTTP请求一般须要半微秒。
当心减小昂贵的系统调用次数。大多数工做默认在用户空间中完成，例如时间读取，缓冲区聚合，文件描述符启用/禁用。
内容分析通过优化，只能携带指向原始数据的指针，除非须要转换数据，不然永远不会复制。这确保了很是小的结构被携带而且在不绝对必要时不会复制内容。

即便在中等负载下，全部这些微优化也会致使CPU使用率很是低。即便在很是高的负载下，当CPU饱和时，一般会注意到5％用户和95％系统等数字，这意味着HAProxy进程比系统对应的消耗少20倍。这就解释了为何调整操做系统很是重要。这就是咱们最终构建本身的设备的缘由，以便从最终用户那里保存复杂而关键的任务。前端

在生产中，当很是昂贵的高端硬件负载平衡器忽然在第7层处理中失败时，HAProxy已经屡次安装做为紧急解决方案。某些硬件负载平衡器仍然不在数据包级别使用代理和处理请求，而且在支持跨多个数据包的请求和高响应时间方面存在很大困难，由于它们根本不进行缓冲。另外一方面，软件负载平衡器使用TCP缓冲，而且对长请求和高响应时间不敏感。一个很好的反作用的HTTP缓冲是经过减小会话持续时间来增长服务器的链接接受度，从而为新请求留出空间。java

有三个重要因素用于衡量负载均衡器的性能：node

会话速率
此因素很是重要，由于它直接肯定负载均衡器什么时候没法分发它收到的全部请求。它主要依赖于CPU。有时候，你会听到关于请求/秒命中/ s，而且它们是相同的会话/秒HTTP / 1.0或HTTP / 1.1与保活禁用。启用保持活动的请求/一般要高得多（由于它显着减小了系统端工做），但对于面向Internet的部署一般没有意义，由于客户端常常打开大量链接，而且在转换时不会为每一个链接发送许多请求。该因子是用不一样的对象大小来测量的，最快的结果一般来自空对象（例如：HTTP 302,304或404响应代码）。2014年，Xeon E5系统的会话速率约为100,000会话/秒。
会话并发
此因素与前一个因素相关联。一般，当并发会话数增长时，会话速率将降低（ epoll或kqueue轮询机制除外）。服务器越慢，同一会话速率的并发会话数越多。若是负载均衡器每秒接收10000个会话，而且服务器在100毫秒内响应，则负载均衡器将具备1000个并发会话。此数量受内存量和系统可处理的文件描述符数量的限制。对于16 kB缓冲区，HAProxy每一个会话须要大约34 kB，这致使每GB大约30000个会话RAM。实际上，系统中的套接字缓冲区也须要一些内存，每GB RAM 20000个会话更合理。第4层负载平衡器一般会宣布数百万个并发会话，由于它们须要处理系统在代理中免费处理的TIME_WAIT套接字。它们也不处理任何数据，所以它们不须要任何缓冲区。此外，它们有时被设计用于直接服务器返回模式，其中负载均衡器仅看到前向流量，而且强制它在结束后长时间保持会话以免在关闭以前切断会话。
数据转发率
该因素一般与会话率相反。它以兆字节/秒（MB / s）为单位，有时以千兆位/秒（Gbps）为单位。使用大型对象能够实现最高的数据速率，从而最大限度地减小会话设置和拆卸形成的开销。大对象一般会增长会话并发性，而高数据速率的高会话并发性须要大量内存来支持大型窗口。高数据速率会在软件负载平衡器上烧毁大量CPU和总线周期，由于必须将数据从输入接口复制到存储器而后再返回到输出设备。硬件负载平衡器倾向于直接将数据包从输入端口切换到输出端口以得到更高的数据速率，但没法处理它们，有时没法触摸标头或cookie。40 Gbps。无风扇1.6 GHz Atom CPU略高于1 Gbps。

负责平衡器与这些因素相关的性能一般是针对最佳状况宣布的（例如：会话速率为空对象，数据速率为大对象）。这不是由于供应商缺少诚实，而是由于没法确切地说出它在每种组合中的表现如何。所以，当知道这3个限制时，客户应该意识到它一般会在全部这些限制之下执行。对软件负载平衡器的一个好的经验法则是考虑平均大小对象的最大会话和数据速率的一半的平均实际性能。web

配置 HAProxy:
正则表达式

2.1 配置文件格式算法

HAProxy的配置处理3类来主要参数来源：
  ——最优先处理的命令行参数，
  ——“global”配置段，用于设定全局配置参数；
  ——proxy相关配置段，如“defaults”、“listen”、“frontend”和“backend”；

2.2 时间格式apache

一些包含了值的参数表示时间，如超时时长。这些值通常以毫秒为单位，但也可使用其它的时间单位后缀。 us: 微秒(microseconds)，即1/1000000秒； ms: 毫秒(milliseconds)，即1/1000秒； s: 秒(seconds)； m: 分钟(minutes)； h：小时(hours)； d: 天(days)；

2.3 例子

下面的例子配置了一个监听在全部接口的80端口上HTTP proxy服务，它转发全部的请求至后端监听在127.0.0.1:8000上的"server"。 global 　　　　　　　　　　#“global”配置中的参数为进程级别的参数，且一般与其运行的OS相关。 daemon maxconn 25600 defaults　　　　　　　　　　　　# “defaults”段用于为全部其它配置段提供默认参数，这配置默认配置参数可由下一个“defaults”所从新设定。 mode http timeout connect 5000ms    timeout client 50000ms
        timeout server 50000ms

    frontend http-in　　　　　　　　#“frontend”段用于定义一系列监听的套接字，这些套接字可接受客户端请求并与之创建链接。
        bind *:80
        default_backend servers

    backend servers　　　　　　　　 #“backend”段用于定义一系列“后端”服务器，代理将会将对应客户端的请求转发至这些服务器。
        server server1 127.0.0.1:8080 maxconn 32

2.4 全局配置

“global”配置中的参数为进程级别的参数，且一般与其运行的OS相关。 * 进程管理及安全相关的参数 - chroot <jail dir>：修改haproxy的工做目录至指定的目录并在放弃权限以前执行chroot()操做，能够提高haproxy的安全级别，不过须要注意的是要确保指定的目录为空目录且任何用户均不能有写权限； - daemon：让haproxy以守护进程的方式工做于后台，其等同于“-D”选项的功能，固然，也能够在命令行中以“-db”选项将其禁用； - gid <number>：以指定的GID运行haproxy，建议使用专用于运行haproxy的GID，以避免因权限问题带来风险； - group <group name>：同gid，不过指定的组名； - log  <address> <facility> [max level [min level]]：定义全局的syslog服务器，最多能够定义两个； - log-send-hostname [<string>]：在syslog信息的首部添加当前主机名，能够为“string”指定的名称，也能够缺省使用当前主机名； - nbproc <number>：指定启动的haproxy进程的个数，只能用于守护进程模式的haproxy；默认只启动一个进程，鉴于调试困难等多方面的缘由，通常只在单进程仅能打开少数文件描述符的场景中才使用多进程模式； - pidfile： - uid：以指定的UID身份运行haproxy进程； - ulimit-n：设定每进程所可以打开的最大文件描述符数目，默认状况下其会自动进行计算，所以不推荐修改此选项； - user：同uid，但使用的是用户名； - stats： - node：定义当前节点的名称，用于HA场景中多haproxy进程共享同一个IP地址时； - description：当前实例的描述信息； * 性能调整相关的参数 - maxconn <number>：设定每一个haproxy进程所接受的最大并发链接数，其等同于命令行选项“-n”；“ulimit -n”自动计算的结果正是参照此参数设定的； - maxpipes <number>：haproxy使用pipe完成基于内核的tcp报文重组，此选项则用于设定每进程所容许使用的最大pipe个数；每一个pipe会打开两个文件描述符，所以，“ulimit -n”自动计算时会根据须要调大此值；默认为maxconn/4，其一般会显得过大； - noepoll：在Linux系统上禁用epoll机制； - nokqueue：在BSD系统上禁用kqueue机制； - nopoll：禁用poll机制； - nosepoll：在Linux禁用启发式epoll机制； - nosplice：禁止在Linux套接字上使用内核tcp重组，这会致使更多的recv/send系统调用；不过，在Linux 2.6.25-28系列的内核上，tcp重组功能有bug存在； - spread-checks <0..50, in percent>：在haproxy后端有着众多服务器的场景中，在精确的时间间隔后统一对众服务器进行健康情况检查可能会带来意外问题；此选项用于将其检查的时间间隔长度上增长或减少必定的随机时长； - tune.bufsize <number>：设定buffer的大小，一样的内存条件下，较小的值可让haproxy有能力接受更多的并发链接，较大的值可让某些应用程序使用较大的cookie信息；默认为16384，其能够在编译时修改，不过强烈建议使用默认值； - tune.chksize <number>：设定检查缓冲区的大小，单位为字节；更大的值有助于在较大的页面中完成基于字符串或模式的文本查找，但也会占用更多的系统资源；不建议修改； - tune.maxaccept <number>：设定haproxy进程内核调度运行时一次性能够接受的链接的个数，较大的值能够带来较大的吞吐率，默认在单进程模式下为100，多进程模式下为8，设定为-1能够禁止此限制；通常不建议修改； - tune.maxpollevents  <number>：设定一次系统调用能够处理的事件最大数，默认值取决于OS；其值小于200时可节约带宽，但会略微增大网络延迟，而大于200时会下降延迟，但会稍稍增长网络带宽的占用量； - tune.maxrewrite <number>：设定为首部重写或追加而预留的缓冲空间，建议使用1024左右的大小；在须要使用更大的空间时，haproxy会自动增长其值； - tune.rcvbuf.client <number>： - tune.rcvbuf.server <number>：设定内核套接字中服务端或客户端接收缓冲的大小，单位为字节；强烈推荐使用默认值； - tune.sndbuf.client： - tune.sndbuf.server： * Debug相关的参数 - debug - quiet

2.5 代理

代理相关的配置能够以下配置段中。 - defaults <name>
 - frontend <name>
 - backend  <name>
 - listen   <name> “defaults”段用于为全部其它配置段提供默认参数，这配置默认配置参数可由下一个“defaults”所从新设定。 “frontend”段用于定义一系列监听的套接字，这些套接字可接受客户端请求并与之创建链接。 “backend”段用于定义一系列“后端”服务器，代理将会将对应客户端的请求转发至这些服务器。 “listen”段经过关联“前端”和“后端”定义了一个完整的代理，一般只对TCP流量有用。

 frontend http-in
        bind *:80
        default_backend servers

    backend servers
        server server1 127.0.0.1:8000 maxconn 32

区别：

isten http-in
        bind *:80
        server server1 127.0.0.1:8000 maxconn 32

 全部代理的名称只能使用大写字母、小写字母、数字、-(中线)、_(下划线)、.(点号)和:(冒号)。此外，ACL名称会区分字母大小写。

3、配置文件中的关键字参考

3.1 balance balance <algorithm> [ <arguments> ] balance url_param <param> [check_post [<max_wait>]] 定义负载均衡算法，可用于“defaults”、“listen”和“backend”。<algorithm>用于在负载均衡场景中挑选一个server，其仅应用于持久信息不可用的条件下或须要将一个链接从新派发至另外一个服务器时。支持的算法有： roundrobin：基于权重进行轮叫，在服务器的处理时间保持均匀分布时，这是最平衡、最公平的算法。此算法是动态的，这表示其权重能够在运行时进行调整，不过，在设计上，每一个后端服务器仅能最多接受4128个链接； static-rr：基于权重进行轮叫，与roundrobin相似，可是为静态方法，在运行时调整其服务器权重不会生效；不过，其在后端服务器链接数上没有限制； leastconn：新的链接请求被派发至具备最少链接数目的后端服务器；在有着较长时间会话的场景中推荐使用此算法，如LDAP、SQL等，其并不太适用于较短会话的应用层协议，如HTTP；此算法是动态的，能够在运行时调整其权重； source：将请求的源地址进行hash运算，并由后端服务器的权重总数相除后派发至某匹配的服务器；这可使得同一个客户端IP的请求始终被派发至某特定的服务器；不过，当服务器权重总数发生变化时，如某服务器宕机或添加了新的服务器，许多客户端的请求可能会被派发至与此前请求不一样的服务器；经常使用于负载均衡无cookie功能的基于TCP的协议；其默认为静态，不过也可使用hash-type修改此特性； 　　　　hash-type：
 　　　　　　　　map-based   静态权重算法
　　　　　　　  consistent   一致性哈希算法


uri：对URI的左半部分(“问题”标记以前的部分)或整个URI进行hash运算，并由服务器的总权重相除后派发至某匹配的服务器；这可使得对同一个URI的请求老是被派发至某特定的服务器，除非服务器的权重总数发生了变化；此算法经常使用于代理缓存或反病毒代理以提升缓存的命中率；须要注意的是，此算法仅应用于HTTP后端服务器场景；其默认为静态算法，不过也可使用hash-type修改此特性；

  　　　　hash-type：
 　　　　　　　　map-based   静态权重算法
　　　　　　　  consistent   一致性哈希算法


　url_param：经过<argument>为URL指定的参数在每一个HTTP GET请求中将会被检索；若是找到了指定的参数且其经过等于号“=”被赋予了一个值，那么此值将被执行hash运算并被服务器的总权重相除后派发至某匹配的服务器；此算法能够经过追踪请求中的用户标识进而确保同一个用户ID的请求将被送往同一个特定的服务器，除非服务器的总权重发生了变化；若是某请求中没有出现指定的参数或其没有有效值，则使用轮叫算法对相应请求进行调度；此算法默认为静态的，不过其也可使用hash-type修改此特性； hdr(<name>)：对于每一个HTTP请求，经过<name>指定的HTTP首部将会被检索；若是相应的首部没有出现或其没有有效值，则使用轮叫算法对相应请求进行调度；其有一个可选选项“use_domain_only”，可在指定检索相似Host类的首部时仅计算域名部分(好比经过www.test.com来讲，仅计算test字符串的hash值)以下降hash算法的运算量；此算法默认为静态的，不过其也可使用hash-type修改此特性，最有用的应该是cookie 字段； rdp-cookie :远程桌面协议 rdp-cookie(name)： 3.2 bind bind [<address>]:<port_range> [, ...] bind [<address>]:<port_range> [, ...] interface <interface> 此指令仅能用于frontend和listen区段，用于定义一个或几个监听的套接字。 <address>：可选选项，其能够为主机名、IPv4地址、IPv6地址或*；省略此选项、将其指定为*或0.0.0.0时，将监听当前系统的全部IPv4地址； <port_range>：能够是一个特定的TCP端口，也但是一个端口范围(如5005-5010)，代理服务器将经过指定的端口来接收客户端请求；须要注意的是，每组监听的套接字<address:port>在同一个实例上只能使用一次，并且小于1024的端口须要有特定权限的用户才能使用，这可能须要经过uid参数来定义； <interface>：指定物理接口的名称，仅能在Linux系统上使用；其不能使用接口别名，而仅能使用物理接口名称，并且只有管理有权限指定绑定的物理接口； 3.3 mode mode { tcp|http|health } 设定实例的运行模式或协议。当实现内容交换时，前端和后端必须工做于同一种模式(通常说来都是HTTP模式)，不然将没法启动实例。 tcp：实例运行于纯TCP模式，在客户端和服务器端之间将创建一个全双工的链接，且不会对7层报文作任何类型的检查；此为默认模式，一般用于SSL、SSH、SMTP等应用； http：实例运行于HTTP模式，客户端请求在转发至后端服务器以前将被深度分析，全部不与RFC格式兼容的请求都会被拒绝； health：实例工做于health模式，其对入站请求仅响应“OK”信息并关闭链接，且不会记录任何日志信息；此模式将用于响应外部组件的健康状态检查请求；目前业讲，此模式已经废弃，由于tcp或http模式中的monitor关键字可完成相似功能； 3.4 hash-type hash-type <method> 定义用于将hash码映射至后端服务器的方法；其不能用于frontend区段；可用方法有map-based和consistent，在大多数场景下推荐使用默认的map-based方法。 map-based：hash表是一个包含了全部在线服务器的静态数组。其hash值将会很是平滑，会将权重考虑在列，但其为静态方法，对在线服务器的权重进行调整将不会生效，这意味着其不支持慢速启动。此外，挑选服务器是根据其在数组中的位置进行的，所以，当一台服务器宕机或添加了一台新的服务器时，大多数链接将会被从新派发至一个与此前不一样的服务器上，对于缓存服务器的工做场景来讲，此方法不甚适用。 consistent：hash表是一个由各服务器填充而成的树状结构；基于hash键在hash树中查找相应的服务器时，最近的服务器将被选中。此方法是动态的，支持在运行时修改服务器权重，所以兼容慢速启动的特性。添加一个新的服务器时，仅会对一小部分请求产生影响，所以，尤为适用于后端服务器为cache的场景。不过，此算法不甚平滑，派发至各服务器的请求未必能达到理想的均衡效果，所以，可能须要不时的调整服务器的权重以得到更好的均衡性。 3.5 log log global log <address> <facility> [<level> [<minlevel>]] 为每一个实例启用事件和流量日志，所以可用于全部区段。每一个实例最多能够指定两个log参数，不过，若是使用了“log global”且"global"段已经定了两个log参数时，多余了log参数将被忽略。 global：当前实例的日志系统参数同"global"段中的定义时，将使用此格式；每一个实例仅能定义一次“log global”语句，且其没有任何额外参数； <address>：定义日志发往的位置，其格式之一能够为<IPv4_address:PORT>，其中的port为UDP协议端口，默认为514；格式之二为Unix套接字文件路径，但须要留心chroot应用及用户的读写权限； <facility>：能够为syslog系统的标准facility之一； <level>：定义日志级别，即输出信息过滤器，默认为全部信息；指定级别时，全部等于或高于此级别的日志信息将会被发送； 3.6 maxconn maxconn <conns> 设定一个前端的最大并发链接数，所以，其不能用于backend区段。对于大型站点来讲，能够尽量提升此值以便让haproxy管理链接队列，从而避免没法应答用户请求。固然，此最大值不能超出“global”段中的定义。此外，须要留心的是，haproxy会为每一个链接维持两个缓冲，每一个缓冲的大小为8KB，再加上其它的数据，每一个链接将大约占用17KB的RAM空间。这意味着通过适当优化后，有着1GB的可用RAM空间时将能维护40000-50000并发链接。 若是为<conns>指定了一个过大值，极端场景下，其最终占据的空间可能会超出当前主机的可用内存，这可能会带来意想不到的结果；所以，将其设定了一个可接受值方为明智决定。其默认为2000。 3.7 default_backend default_backend <backend> 在没有匹配的"use_backend"规则时为实例指定使用的默认后端，所以，其不可应用于backend区段。在"frontend"和"backend"之间进行内容交换时，一般使用"use-backend"定义其匹配规则；而没有被规则匹配到的请求将由此参数指定的后端接收。 <backend>：指定使用的后端的名称； 使用案例： use_backend dynamic if url_dyn use_backend static if url_css url_img extension_img default_backend dynamic 3.8 server server <name> <address>[:port] [param*] 为后端声明一个server，所以，不能用于defaults和frontend区段。 <name>：为此服务器指定的内部名称，其将出如今日志及警告信息中；若是设定了"http-send-server-name"，它还将被添加至发往此服务器的请求首部中； <address>：此服务器的的IPv4地址，也支持使用可解析的主机名，只不过在启动时须要解析主机名至相应的IPv4地址； [:port]：指定将链接请求所发往的此服务器时的目标端口，其为可选项；未设定时，将使用客户端请求时的同一相端口； [param*]：为此服务器设定的一系参数；其可用的参数很是多，具体请参考官方文档中的说明，下面仅说明几个经常使用的参数； 服务器或默认服务器参数： backup：设定为备用服务器，仅在负载均衡场景中的其它server均不可用于启用此server； check：启动对此server执行健康状态检查，其能够借助于额外的其它参数完成更精细的设定，如： inter <delay>：设定健康状态检查的时间间隔，单位为毫秒，默认为2000；也可使用fastinter和downinter来根据服务器端状态优化此时间延迟； rise <count>：设定健康状态检查中，某离线的server从离线状态转换至正常状态须要成功检查的次数； fall <count>：确认server从正常状态转换为不可用状态须要检查的次数； cookie <value>：为指定server设定cookie值，此处指定的值将在请求入站时被检查，第一次为此值挑选的server将在后续的请求中被选中，其目的在于实现持久链接的功能；

基于浏览器cookie实现session sticky：
            backend websrvs
                balance     roundrobin
                cookie SERVERID insert nocache indirect
                server web1 172.16.100.68:80 check weight 1 cookie websrv1
                server web2 172.16.100.69:80 check weight 3 cookie websrv2

            要点：
                (1) 每一个server有本身唯一的cookie标识；
                (2) 在backend中定义为用户请求调度完成后操纵其cookie

 maxconn <maxconn>：指定此服务器接受的最大并发链接数；若是发往此服务器的链接数目高于此处指定的值，其将被放置于请求队列，以等待其它链接被释放； maxqueue <maxqueue>：设定请求队列的最大长度； observe <mode>：经过观察服务器的通讯情况来断定其健康状态，默认为禁用，其支持的类型有“layer4”和“layer7”，“layer7”仅能用于http代理场景； redir <prefix>：启用重定向功能，将发往此服务器的GET和HEAD请求均以302状态码响应；须要注意的是，在prefix后面不能使用/，且不能使用相对地址，以避免形成循环；例如： server srv1 172.16.100.6:80 redir http://imageserver.test.com check
weight <weight>：权重，默认为1，最大值为256，0表示不参与负载均衡； 检查方法： option httpchk option httpchk <uri> option httpchk <method> <uri> option httpchk <method> <uri> <version>：不能用于frontend段，例如： backend https_relay mode tcp option httpchk OPTIONS * HTTP/1.1\r\nHost:\ www.test.com server apache1 192.168.1.1:443 check port 80 使用案例： server first 172.16.100.7:1080 cookie first  check inter 1000 server second 172.16.100.8:1080 cookie second check inter 1000

3.9 capture request header capture request header <name> len <length> 捕获并记录指定的请求首部最近一次出现时的第一个值，仅能用于“frontend”和“listen”区段。捕获的首部值使用花括号{}括起来后添加进日志中。若是须要捕获多个首部值，它们将以指定的次序出如今日志文件中，并以竖线“|”做为分隔符。不存在的首部记录为空字符串，最常须要捕获的首部包括在虚拟主机环境中使用的“Host”、上传请求首部中的“Content-length”、快速区别真实用户和网络机器人的“User-agent”，以及代理环境中记录真实请求来源的“X-Forward-For”。 <name>：要捕获的首部的名称，此名称不区分字符大小写，但建议与它们出如今首部中的格式相同，好比大写首字母。须要注意的是，记录在日志中的是首部对应的值，而非首部名称。 <length>：指定记录首部值时所记录的精确长度，超出的部分将会被忽略。 能够捕获的请求首部的个数没有限制，但每一个捕获最多只能记录64个字符。为了保证同一个frontend中日志格式的统一性，首部捕获仅能在frontend中定义。 3.10 capture response header capture response header <name> len <length> 捕获并记录响应首部，其格式和要点同请求首部。 3.11 stats enable 启用基于程序编译时默认设置的统计报告，不能用于“frontend”区段。只要没有另外的其它设定，它们就会使用以下的配置： - stats uri   : /haproxy?stats - stats realm : "HAProxy Statistics"
  - stats auth : no authentication - stats scope : no restriction 尽管“stats enable”一条就可以启用统计报告，但仍是建议设定其它全部的参数，以避免其依赖于默认设定而带来非期后果。下面是一个配置案例。 backend public_www server websrv1 172.16.100.11:80 stats enable stats hide-version stats scope . stats uri /haproxyadmin?stats stats realm Haproxy\ Statistics stats auth statsadmin:password stats auth statsmaster:password 3.12 stats hide-version stats hide-version 启用统计报告并隐藏HAProxy版本报告，不能用于“frontend”区段。默认状况下，统计页面会显示一些有用信息，包括HAProxy的版本号，然而，向全部人公开HAProxy的精确版本号是很是有风险的，由于它能帮助恶意用户快速定位版本的缺陷和漏洞。尽管“stats hide-version”一条就可以启用统计报告，但仍是建议设定其它全部的参数，以避免其依赖于默认设定而带来非期后果。具体请参照“stats enable”一节的说明。 3.13 stats realm stats realm <realm> 启用统计报告并高精认证领域，不能用于“frontend”区段。haproxy在读取realm时会将其视做一个单词，所以，中间的任何空白字符都必须使用反斜线进行转义。此参数仅在与“stats auth”配置使用时有意义。 <realm>：实现HTTP基本认证时显示在浏览器中的领域名称，用于提示用户输入一个用户名和密码。 尽管“stats realm”一条就可以启用统计报告，但仍是建议设定其它全部的参数，以避免其依赖于默认设定而带来非期后果。具体请参照“stats enable”一节的说明。 3.14 stats scope stats scope { <name> | "." } 启用统计报告并限定报告的区段，不能用于“frontend”区段。当指定此语句时，统计报告将仅显示其列举出区段的报告信息，全部其它区段的信息将被隐藏。若是须要显示多个区段的统计报告，此语句能够定义屡次。须要注意的是，区段名称检测仅仅是以字符串比较的方式进行，它不会真检测指定的区段是否真正存在。 <name>：能够是一个“listen”、“frontend”或“backend”区段的名称，而“.”则表示stats scope语句所定义的当前区段。 尽管“stats scope”一条就可以启用统计报告，但仍是建议设定其它全部的参数，以避免其依赖于默认设定而带来非期后果。下面是一个配置案例。 backend private_monitoring stats enable stats uri /haproxyadmin?stats stats refresh 10s 3.15 stats auth stats auth <user>:<passwd> 启用带认证的统计报告功能并受权一个用户账号，其不能用于“frontend”区段。 <user>：受权进行访问的用户名； <passwd>：此用户的访问密码，明文格式； 此语句将基于默认设定启用统计报告功能，并仅容许其定义的用户访问，其也能够定义屡次以受权多个用户账号。能够结合“stats realm”参数在提示用户认证时给出一个领域说明信息。在使用非法用户访问统计功能时，其将会响应一个“401 Forbidden”页面。其认证方式为HTTP Basic认证，密码传输会以明文方式进行，所以，配置文件中也使用明文方式存储以说明其非保密信息故此不能相同于其它关键性账号的密码。 尽管“stats auth”一条就可以启用统计报告，但仍是建议设定其它全部的参数，以避免其依赖于默认设定而带来非期后果。 3.16 stats admin stats admin { if | unless } <cond> 在指定的条件知足时启用统计报告页面的管理级别功能，它容许经过web接口启用或禁用服务器，不过，基于安全的角度考虑，统计报告页面应该尽量为只读的。此外，若是启用了HAProxy的多进程模式，启用此管理级别将有可能致使异常行为。 目前来讲，POST请求方法被限制于仅能使用缓冲区减去保留部分以外的空间，所以，服务器列表不能过长，不然，此请求将没法正常工做。所以，建议一次仅调整少数几个服务器。下面是两个案例，第一个限制了仅能在本机打开报告页面时启用管理级别功能，第二个定义了仅容许经过认证的用户使用管理级别功能。 backend stats_localhost stats enable stats admin if LOCALHOST backend stats_auth stats enable stats auth haproxyadmin:password stats admin if TRUE

frontend  main *:8080

    default_backend             webserver

listen stats_test          #配置stats 监听实例
    bind *:1080            #绑定监听端口 1080
    stats enable           #启动stats 功能
    stats hide-version     #隐藏 haproxy 版本
    #stats scope .         #指定管理范围
    stats uri /haproxyadmin?stats        #指定访问路径
    stats realm "HAproxy\ Statistics"     #指定名称
    stats auth   zy:zzzzy                #指定认证用户名，密码
    stats admin if TRUE     #启用管理功能





 3.17 option httplog option httplog [ clf ] 启用记录HTTP请求、会话状态和计时器的功能。 clf：使用CLF格式来代替HAProxy默认的HTTP格式，一般在使用仅支持CLF格式的特定日志分析器时才须要使用此格式。 默认状况下，日志输入格式很是简陋，由于其仅包括源地址、目标地址和实例名称，而“option httplog”参数将会使得日志格式变得丰富许多，其一般包括但不限于HTTP请求、链接计时器、会话状态、链接数、捕获的首部及cookie、“frontend”、“backend”及服务器名称，固然也包括源地址和端口号等。 3.18 option logasap no option logasap option logasap no option logasap 启用或禁用提早将HTTP请求记入日志，不能用于“backend”区段。 默认状况下，HTTP请求是在请求结束时进行记录以便能将其总体传输时长和字节数记入日志，由此，传较大的对象时，其记入日志的时长可能会略有延迟。“option logasap”参数可以在服务器发送complete首部时即时记录日志，只不过，此时将不记录总体传输时长和字节数。此情形下，捕获“Content-Length”响应首部来记录传输的字节数是一个较好选择。下面是一个例子。 listen http_proxy 0.0.0.0:80 mode http option httplog option logasap log 172.16.100.9 local2 3.19 option forwardfor option forwardfor [ except <network> ] [ header <name> ] [ if-none ] 容许在发往服务器的请求首部中插入“X-Forwarded-For”首部。 <network>：可选参数，当指定时，源地址为匹配至此网络中的请求都禁用此功能。 <name>：可选参数，可以使用一个自定义的首部，如“X-Client”来替代“X-Forwarded-For”。有些独特的web服务器的确须要用于一个独特的首部。 if-none：仅在此首部不存在时才将其添加至请求报文问道中。 HAProxy工做于反向代理模式，其发往服务器的请求中的客户端IP均为HAProxy主机的地址而非真正客户端的地址，这会使得服务器端的日志信息记录不了真正的请求来源，“X-Forwarded-For”首部则可用于解决此问题。HAProxy能够向每一个发往服务器的请求上添加此首部，并以客户端IP为其value。 须要注意的是，HAProxy工做于隧道模式，其仅检查每个链接的第一个请求，所以，仅第一个请求报文被附加此首部。若是想为每个请求都附加此首部，请确保同时使用了“option httpclose”、“option forceclose”和“option http-server-close”几个option。 下面是一个例子。 frontend www mode http option forwardfor except 127.0.0.1

3.20 errorfile errorfile <code> <file> 在用户请求不存在的页面时，返回一个页面文件给客户端而非由haproxy生成的错误代码；可用于全部段中。 <code>：指定对HTTP的哪些状态码返回指定的页面；这里可用的状态码有200、400、403、408、500、502、503和504； <file>：指定用于响应的页面文件； 例如： errorfile 400 /etc/haproxy/errorpages/400badreq.http errorfile 403 /etc/haproxy/errorpages/403forbid.http errorfile 503 /etc/haproxy/errorpages/503sorry.http 3.21 errorloc 和 errorloc302 
　　　　　　#errorloc location 方式
　　　　　　# errorloc302 重定向方式
 errorloc <code> <url> errorloc302 <code> <url> 请求错误时，返回一个HTTP重定向至某URL的信息；可用于全部配置段中。 <code>：指定对HTTP的哪些状态码返回指定的页面；这里可用的状态码有200、400、403、408、500、502、503和504； <url>：Location首部中指定的页面位置的具体路径，能够是在当前服务器上的页面的相对路径，也可使用绝对路径；须要注意的是，若是URI自身错误时产生某特定状态码信息的话，有可能会致使循环定向； 须要留意的是，这两个关键字都会返回302状态吗，这将使得客户端使用一样的HTTP方法获取指定的URL，对于非GET法的场景(如POST)来讲会产生问题，由于返回客户的URL是不容许使用GET之外的其它方法的。若是的确有这种问题，可使用errorloc303来返回303状态码给客户端。 3.22 errorloc303 errorloc303 <code> <url> 请求错误时，返回一个HTTP重定向至某URL的信息给客户端；可用于全部配置段中。 <code>：指定对HTTP的哪些状态码返回指定的页面；这里可用的状态码有400、403、408、500、502、503和504； <url>：Location首部中指定的页面位置的具体路径，能够是在当前服务器上的页面的相对路径，也可使用绝对路径；须要注意的是，若是URI自身错误时产生某特定状态码信息的话，有可能会致使循环定向； 例如： backend webserver server 172.16.100.6 172.16.100.6:80 check maxconn 3000 cookie srv01 server 172.16.100.7 172.16.100.7:80 check maxconn 3000 cookie srv02 errorloc 403 /etc/haproxy/errorpages/sorry.htm errorloc 503 /etc/haproxy/errorpages/sorry.htm

5、ACL

haproxy的ACL用于实现基于请求报文的首部、响应报文的内容或其它的环境状态信息来作出转发决策，这大大加强了其配置弹性。其配置法则一般分为两步，首先去定义ACL，即定义一个测试条件，然后在条件获得知足时执行某特定的动做，如阻止请求或转发至某特定的后端。定义ACL的语法格式以下。 acl <aclname> <criterion> [flags] [operator] <value> ... <aclname>：ACL名称，区分字符大小写，且其只能包含大小写字母、数字、-(链接线)、_(下划线)、.(点号)和:(冒号)；haproxy中，acl能够重名，这能够把多个测试条件定义为一个共同的acl； <criterion>：测试标准，即对什么信息发起测试；测试方式能够由[flags]指定的标志进行调整；而有些测试标准也能够须要为其在<value>以前指定一个操做符[operator]； [flags]：目前haproxy的acl支持的标志位有3个： -i：不区分<value>中模式字符的大小写； -f：从指定的文件中加载模式； --：标志符的强制结束标记，在模式中的字符串像标记符时使用； <value>：acl测试条件支持的值有如下四类： 整数或整数范围：如1024:65535表示从1024至65535；仅支持使用正整数(若是出现相似小数的标识，其为一般为版本测试)，且支持使用的操做符有5个，分别为eq、ge、gt、le和lt； 字符串：支持使用“-i”以忽略字符大小写，支持使用“\”进行转义；若是在模式首部出现了-i，能够在其以前使用“--”标志位； 正则表达式：其机制类同字符串匹配； IP地址及网络地址 同一个acl中能够指定多个测试条件，这些测试条件须要由逻辑操做符指定其关系。条件间的组合测试关系有三种：“与”(默认即为与操做)、“或”(使用“||”操做符)以及“非”(使用“!”操做符)。 5.1 经常使用的测试标准(criteria) 5.1.1 be_sess_rate <integer> be_sess_rate(backend) <integer> 用于测试指定的backend上会话建立的速率(即每秒建立的会话数)是否知足指定的条件；经常使用于在指定backend上的会话速率太高时将用户请求转发至另外的backend，或用于阻止攻击行为。例如： backend dynamic mode http acl being_scanned be_sess_rate gt 50 redirect location /error_pages/denied.html if being_scanned 5.1.2 fe_sess_rate <integer> fe_sess_rate(frontend) <integer> 用于测试指定的frontend(或当前frontend)上的会话建立速率是否知足指定的条件；经常使用于为frontend指定一个合理的会话建立速率的上限以防止服务被滥用。例以下面的例子限定入站邮件速率不能大于50封/秒，全部在此指定范围以外的请求都将被延时50毫秒。 frontend mail bind :25 mode tcp maxconn 500 acl too_fast fe_sess_rate ge 50 tcp-request inspect-delay 50ms tcp-request content accept if ! too_fast tcp-request content accept if WAIT_END 5.1.3 hdr <string> hdr(header) <string> 用于测试请求报文中的全部首部或指定首部是否知足指定的条件；指定首部时，其名称不区分大小写，且在括号“()”中不能有任何多余的空白字符。测试服务器端的响应报文时可使用shdr()。例以下面的例子用于测试首部Connection的值是否为close。 hdr(Connection) -i close 5.1.4 method <string> method <string> 测试HTTP请求报文中使用的方法。 5.1.5 path_beg <string> 用于测试请求的URL是否以<string>指定的模式开头。下面的例子用于测试URL是否以/static、/images、/javascript或/stylesheets头。 acl url_static path_beg -i /static /images /javascript /stylesheets 5.1.6 path_end <string> 用于测试请求的URL是否以<string>指定的模式结尾。例如，下面的例子用户测试URL是否以jpg、gif、png、css或js结尾。 acl url_static path_end -i .jpg .gif .png .css .js 5.1.7 hdr_beg <string> 用于测试请求报文的指定首部的开头部分是否符合<string>指定的模式。例如，下面的例子用记测试请求是否为提供静态内容的主机img、video、download或ftp。 acl host_static hdr_beg(host) -i img. video. download. ftp. 5.1.8 hdr_end <string> 用于测试请求报文的指定首部的结尾部分是否符合<string>指定的模式。

   acl url_static  path_beg         /static /images /img /css
   acl url_static  path_end         .gif .png .jpg .css .js
   acl host_www    hdr_beg(host) -i www
   acl host_static hdr_beg(host) -i img. video. download. ftp.

acl es req.fhdr(accept-language),language(es;fr;en) -m str es
acl fr req.fhdr(accept-language),language(es;fr;en) -m str fr
acl en req.fhdr(accept-language),language(es;fr;en) -m str en
use_backend spanish if es
use_backend french  if fr
use_backend english if en
default_backend choose_your_language

acl clear      dst_port  80
acl secure     dst_port  8080
acl login_page url_beg   /login
acl logout     url_beg   /logout
acl uid_given  url_reg   /login?userid=[^&]+
acl cookie_set hdr_sub(cookie) SEEN=1

redirect prefix   https://mysite.com set-cookie SEEN=1 if !cookie_set
redirect prefix   https://mysite.com           if login_page !secure
redirect prefix   http://mysite.com drop-query if login_page !uid_given
redirect location http://mysite.com/           if !login_page secure
redirect location / clear-cookie USERID=       if logout

访问控制：
        http_request
        tcp_request

自定义报文首部：

　　具体使用方法请查看官方文档

 - reqadd     <string>
  - reqallow   <search>
  - reqiallow  <search>
  - reqdel     <search>
  - reqidel    <search>
  - reqdeny    <search>
  - reqideny   <search>
  - reqpass    <search>
  - reqipass   <search>
  - reqrep     <search> <replace>
  - reqirep    <search> <replace>
  - reqtarpit  <search>
  - reqitarpit <search>
  - rspadd     <string>
  - rspdel     <search>
  - rspidel    <search>
  - rspdeny    <search>
  - rspideny   <search>
  - rsprep     <search> <replace>
  - rspirep    <search> <replace>