haproxy 详细配置

时间 2020-05-16

原文原文链接

配置文件安装目录：/etc/haproxy/haproxy.conf
haproxy的配置文件分为四个部分：
全局配置：
global：全局配置段
代理配置：
default：默认配置----->全部在backend、frontend、linsten中相同内容能够在此定义；
frontend：前段配置----->定义前端套接字，接受客户端请求；
backend：后端配置----->定义后端分配规则，与后端服务器交互；
listen：绑定配置----->直接将指定的客户端与后端特定服务器绑定到一块儿；
一般没有特别需求，不须要手动调试配置文件里面的选项，大部分默认值就能够知足咱们的需求；并且官方文档介绍说不少选项都建议使用默认。可是有些选项咱们常常要打交道的，必须对其有必定了解和调试的能力，下面介绍一些经常使用选项的配置。css

--------------------------------------------------------------------------------

giobal
--------------------------------------------------------------------------------
* 进程管理及安全相关的参数
- chroot <jail dir>：修改haproxy的工做目录至指定的目录并在放弃权限以前执行chroot()操做，能够提高haproxy的安全级别，不过须要注意的是要确保指定的目录为空目录且任何用户均不能有写权限；
- daemon：让haproxy以守护进程的方式工做于后台，其等同于“-D”选项的功能，固然，也能够在命令行中以“-db”选项将其禁用；
- gid <number>：以指定的GID运行haproxy，建议使用专用于运行haproxy的GID，以避免因权限问题带来风险；
- group <group name>：同gid，不过指定的组名；
- log <address> <facility> [max level [min level]]：定义全局的syslog服务器，最多能够定义两个；
- log-send-hostname [<string>]：在syslog信息的首部添加当前主机名，能够为“string”指定的名称，也能够缺省使用当前主机名；
- nbproc <number>：指定启动的haproxy进程的个数，只能用于守护进程模式的haproxy；默认只启动一个进程，鉴于调试困难等多方面的缘由，通常只在单进程仅能打开少数文件描述符的场景中才使用多进程模式；
- pidfile：
- uid：以指定的UID身份运行haproxy进程；
- ulimit-n：设定每进程所可以打开的最大文件描述符数目，默认状况下其会自动进行计算，所以不推荐修改此选项；
- user：同uid，但使用的是用户名；
- stats：
- node：定义当前节点的名称，用于HA场景中多haproxy进程共享同一个IP地址时；
- description：当前实例的描述信息；前端

* 性能调整相关的参数
- maxconn <number>：设定每一个haproxy进程所接受的最大并发链接数，其等同于命令行选项“-n”；“ulimit -n”自动计算的结果正是参照此参数设定的；
- maxpipes <number>：haproxy使用pipe完成基于内核的tcp报文重组，此选项则用于设定每进程所容许使用的最大pipe个数；每一个pipe会打开两个文件描述符，所以，“ulimit -n”自动计算时会根据须要调大此值；默认为maxconn/4，其一般会显得过大；
- noepoll：在Linux系统上禁用epoll机制；
- nokqueue：在BSD系统上禁用kqueue机制；
- nopoll：禁用poll机制；
- nosepoll：在Linux禁用启发式epoll机制；
- nosplice：禁止在Linux套接字上使用内核tcp重组，这会致使更多的recv/send系统调用；不过，在Linux 2.6.25-28系列的内核上，tcp重组功能有bug存在；
- spread-checks <0..50, in percent>：在haproxy后端有着众多服务器的场景中，在精确的时间间隔后统一对众服务器进行健康情况检查可能会带来意外问题；此选项用于将其检查的时间间隔长度上增长或减少必定的随机时长；
- tune.bufsize <number>：设定buffer的大小，一样的内存条件下，较小的值可让haproxy有能力接受更多的并发链接，较大的值可让某些应用程序使用较大的cookie信息；默认为16384，其能够在编译时修改，不过强烈建议使用默认值；
- tune.chksize <number>：设定检查缓冲区的大小，单位为字节；更大的值有助于在较大的页面中完成基于字符串或模式的文本查找，但也会占用更多的系统资源；不建议修改；
- tune.maxaccept <number>：设定haproxy进程内核调度运行时一次性能够接受的链接的个数，较大的值能够带来较大的吞吐率，默认在单进程模式下为100，多进程模式下为8，设定为-1能够禁止此限制；通常不建议修改；
- tune.maxpollevents <number>：设定一次系统调用能够处理的事件最大数，默认值取决于OS；其值小于200时可节约带宽，但会略微增大网络延迟，而大于200时会下降延迟，但会稍稍增长网络带宽的占用量；
- tune.maxrewrite <number>：设定为首部重写或追加而预留的缓冲空间，建议使用1024左右的大小；在须要使用更大的空间时，haproxy会自动增长其值；
- tune.rcvbuf.client <number>：
- tune.rcvbuf.server <number>：设定内核套接字中服务端或客户端接收缓冲的大小，单位为字节；强烈推荐使用默认值；
- tune.sndbuf.client：
- tune.sndbuf.server：
* Debug相关的参数
- debug
- quiet
------------------------------------------------------------------------------------
node

--------------------------------------------------------------------------------
balance 算法
balance <algorithm> [ <arguments> ]
balance url_param <param> [check_post [<max_wait>]]
定义负载均衡算法，可用于“defaults”、“listen”和“backend”。<algorithm>用于在负载均衡场景中挑选一个server，其仅应用于持久信息不可用的条件下或须要将一个链接从新派发至另外一个服务器时。支持的算法有：
roundrobin：基于权重进行轮叫，在服务器的处理时间保持均匀分布时，这是最平衡、最公平的算法。此算法是动态的，这表示其权重能够在运行时进行调整，不过，在设计上，每一个后端服务器仅能最多接受4128个链接；
static-rr：基于权重进行轮叫，与roundrobin相似，可是为静态方法，在运行时调整其服务器权重不会生效；不过，其在后端服务器链接数上没有限制；
leastconn：新的链接请求被派发至具备最少链接数目的后端服务器；在有着较长时间会话的场景中推荐使用此算法，如LDAP、SQL等，其并不太适用于较短会话的应用层协议，如HTTP；此算法是动态的，能够在运行时调整其权重；
source：将请求的源地址进行hash运算，并由后端服务器的权重总数相除后派发至某匹配的服务器；这可使得同一个客户端IP的请求始终被派发至某特定的服务器；不过，当服务器权重总数发生变化时，如某服务器宕机或添加了新的服务器，许多客户端的请求可能会被派发至与此前请求不一样的服务器；经常使用于负载均衡无cookie功能的基于TCP的协议；其默认为静态，不过也可使用hash-type修改此特性；
hash-type：
map-based：静态；哈希算法
consistent：动态；一致性哈希算法
uri：对URI的左半部分(“问题”标记以前的部分)或整个URI进行hash运算，并由服务器的总权重相除后派发至某匹配的服务器；这可使得对同一个URI的请求老是被派发至某特定的服务器，除非服务器的权重总数发生了变化；此算法经常使用于代理缓存或反病毒代理以提升缓存的命中率；须要注意的是，此算法仅应用于HTTP后端服务器场景；其默认为静态算法，不过也可使用hash-type修改此特性；
url_param：经过<argument>为URL指定的参数在每一个HTTP GET请求中将会被检索；若是找到了指定的参数且其经过等于号“=”被赋予了一个值，那么此值将被执行hash运算并被服务器的总权重相除后派发至某匹配的服务器；此算法能够经过追踪请求中的用户标识进而确保同一个用户ID的请求将被送往同一个特定的服务器，除非服务器的总权重发生了变化；若是某请求中没有出现指定的参数或其没有有效值，则使用轮叫算法对相应请求进行调度；此算法默认为静态的，不过其也可使用hash-type修改此特性；
hdr(<name>)：对于每一个HTTP请求，经过<name>指定的HTTP首部将会被检索；若是相应的首部没有出现或其没有有效值，则使用轮叫算法对相应请求进行调度；其有一个可选选项“use_domain_only”，可在指定检索相似Host类的首部时仅计算域名部分(好比经过www.linuxidc.com来讲，仅计算linuxidc字符串的hash值)以下降hash算法的运算量；此算法默认为静态的，不过其也可使用hash-type修改此特性；linux

--------------------------------------------------------------------------------
hash-type
hash-type <method>
定义用于将hash码映射至后端服务器的方法；其不能用于frontend区段；可用方法有map-based和consistent，在大多数场景下推荐使用默认的map-based方法。
map-based：hash表是一个包含了全部在线服务器的静态数组。其hash值将会很是平滑，会将权重考虑在列，但其为静态方法，对在线服务器的权重进行调整将不会生效，这意味着其不支持慢速启动。此外，挑选服务器是根据其在数组中的位置进行的，所以，当一台服务器宕机或添加了一台新的服务器时，大多数链接将会被从新派发至一个与此前不一样的服务器上，对于缓存服务器的工做场景来讲，此方法不甚适用。
consistent：hash表是一个由各服务器填充而成的树状结构；基于hash键在hash树中查找相应的服务器时，最近的服务器将被选中。此方法是动态的，支持在运行时修改服务器权重，所以兼容慢速启动的特性。添加一个新的服务器时，仅会对一小部分请求产生影响，所以，尤为适用于后端服务器为cache的场景。不过，此算法不甚平滑，派发至各服务器的请求未必能达到理想的均衡效果，所以，可能须要不时的调整服务器的权重以得到更好的均衡性。web

--------------------------------------------------------------------------------
bind
bind [<address>]:<port_range> [, ...]
bind [<address>]:<port_range> [, ...] interface <interface>
此指令仅能用于frontend和listen区段，用于定义一个或几个监听的套接字。
<address>：可选选项，其能够为主机名、IPv4地址、IPv6地址或*；省略此选项、将其指定为*或0.0.0.0时，将监听当前系统的全部IPv4地址；
<port_range>：能够是一个特定的TCP端口，也但是一个端口范围(如5005-5010)，代理服务器将经过指定的端口来接收客户端请求；须要注意的是，每组监听的套接字<address:port>在同一个实例上只能使用一次，并且小于1024的端口须要有特定权限的用户才能使用，这可能须要经过uid参数来定义；
<interface>：指定物理接口的名称，仅能在Linux系统上使用；其不能使用接口别名，而仅能使用物理接口名称，并且只有管理有权限指定绑定的物理接口；
例如：
forntend main
bind *:80
bind *:8080算法

--------------------------------------------------------------------------------

mode
mode { tcp|http|health }
设定实例的运行模式或协议。当实现内容交换时，前端和后端必须工做于同一种模式(通常说来都是HTTP模式)，不然将没法启动实例。
tcp：实例运行于纯TCP模式，在客户端和服务器端之间将创建一个全双工的链接，且不会对7层报文作任何类型的检查；此为默认模式，一般用于SSL、SSH、SMTP等应用；
http：实例运行于HTTP模式，客户端请求在转发至后端服务器以前将被深度分析，全部不与RFC格式兼容的请求都会被拒绝；
health：实例工做于health模式，其对入站请求仅响应“OK”信息并关闭链接，且不会记录任何日志信息；此模式将用于响应外部组件的健康状态检查请求；目前业讲，此模式已经废弃，由于tcp或http模式中的monitor关键字可完成相似功能；apache

--------------------------------------------------------------------------------
log
log global
log <address> <facility> [<level> [<minlevel>]]
为每一个实例启用事件和流量日志，所以可用于全部区段。每一个实例最多能够指定两个log参数，不过，若是使用了“log global”且"global"段已经定了两个log参数时，多余了log参数将被忽略。
global：当前实例的日志系统参数同"global"段中的定义时，将使用此格式；每一个实例仅能定义一次“log global”语句，且其没有任何额外参数；
<address>：定义日志发往的位置，其格式之一能够为<IPv4_address:PORT>，其中的port为UDP协议端口，默认为514；格式之二为Unix套接字文件路径，但须要留心chroot应用及用户的读写权限；
<facility>：能够为syslog系统的标准facility之一；
<level>：定义日志级别，即输出信息过滤器，默认为全部信息；指定级别时，全部等于或高于此级别的日志信息将会被发送；后端

--------------------------------------------------------------------------------
maxconn
maxconn <conns>
设定一个前端的最大并发链接数，所以，其不能用于backend区段。对于大型站点来讲，能够尽量提升此值以便让haproxy管理链接队列，从而避免没法应答用户请求。固然，此最大值不能超出“global”段中的定义。此外，须要留心的是，haproxy会为每一个链接维持两个缓冲，每一个缓冲的大小为8KB，再加上其它的数据，每一个链接将大约占用17KB的RAM空间。这意味着通过适当优化后，有着1GB的可用RAM空间时将能维护40000-50000并发链接。
若是为<conns>指定了一个过大值，极端场景下，其最终占据的空间可能会超出当前主机的可用内存，这可能会带来意想不到的结果；所以，将其设定了一个可接受值方为明智决定。其默认为2000。数组

--------------------------------------------------------------------------------

default_backend
default_backend <backend>
在没有匹配的"use_backend"规则时为实例指定使用的默认后端，所以，其不可应用于backend区段。在"frontend"和"backend"之间进行内容交换时，一般使用"use-backend"定义其匹配规则；而没有被规则匹配到的请求将由此参数指定的后端接收。
<backend>：指定使用的后端的名称；
使用案例：
use_backend dynamic if url_dyn
use_backend static if url_css url_img extension_img
default_backend dynamic浏览器

--------------------------------------------------------------------------------

server 定义后端服务器
------------------------------------------------------------------------------------
server <name> <address>[:port] [param*]
为后端声明一个server，所以，不能用于defaults和frontend区段。
<name>：为此服务器指定的内部名称，其将出如今日志及警告信息中；若是设定了"http-send-server-name"，它还将被添加至发往此服务器的请求首部中；
<address>：此服务器的的IPv4地址，也支持使用可解析的主机名，只不过在启动时须要解析主机名至相应的IPv4地址；
[:port]：指定将链接请求所发往的此服务器时的目标端口，其为可选项；未设定时，将使用客户端请求时的同一相端口；
[param*]：为此服务器设定的一系参数；其可用的参数很是多，具体请参考官方文档中的说明，下面仅说明几个经常使用的参数；
---------------------------------------------------
服务器或默认服务器参数：

disabled：这只此服务器禁用；
backup：设定为备用服务器，仅在负载均衡场景中的其它server均不可用于启用此server；
check：启动对此server执行健康状态检查，其能够借助于额外的其它参数完成更精细的设定，如：
inter <delay>：设定健康状态检查的时间间隔，单位为毫秒，默认为2000；也可使用fastinter和downinter来根据服务器端状态优化此时间延迟；
rise <count>：设定健康状态检查中，某离线的server从离线状态转换至正常状态须要成功检查的次数；
fall <count>：确认server从正常状态转换为不可用状态须要检查的次数；
cookie <value>：为指定server设定cookie值，此处指定的值将在请求入站时被检查，第一次为此值挑选的server将在后续的请求中被选中，其目的在于实现持久链接的功能；
maxconn <maxconn>：指定此服务器接受的最大并发链接数；若是发往此服务器的链接数目高于此处指定的值，其将被放置于请求队列，以等待其它链接被释放；
maxqueue <maxqueue>：设定请求队列的最大长度；0表示无上限；
observe <mode>：经过观察服务器的通讯情况来断定其健康状态，默认为禁用，其支持的类型有 “layer4” 和 “layer7”， “layer7”仅能用于http代理场景；
redir <prefix>：启用重定向功能，将发往此服务器的GET和HEAD请求均以302状态码响应；须要注意的是，在prefix后面不能使用/，且不能使用相对地址，以避免形成循环；例如：
server srv1 172.16.100.6:80 redir http://p_w_picpathserver.linuxidc.com check
weight <weight>：权重，默认为1，最大值为256，0表示不参与负载均衡；
检查方法：
option httpchk
option httpchk <uri>
option httpchk <method> <uri>
option httpchk <method> <uri> <version>：不能用于frontend段，例如：
backend https_relay
mode tcp
option httpchk OPTIONS * HTTP/1.1\r\nHost:\ www.linuxidc.com
server apache1 192.168.1.1:443 check port 80
使用案例：

server first 172.16.13.13:1080 cookie first check inter 1000
server second 172.16.13.14:1080 cookie second check inter 1000

-------------------------------------------------------------------------------------

--------------------------------------------------------------------------------
capture request header
capture request header <name> len <length>
捕获并记录指定的请求首部最近一次出现时的第一个值，仅能用于“frontend”和“listen”区段。捕获的首部值使用花括号{}括起来后添加进日志中。若是须要捕获多个首部值，它们将以指定的次序出如今日志文件中，并以竖线“|”做为分隔符。不存在的首部记录为空字符串，最常须要捕获的首部包括在虚拟主机环境中使用的“Host”、上传请求首部中的“Content-length”、快速区别真实用户和网络机器人的“User-agent”，以及代理环境中记录真实请求来源的“X-Forward-For”。
<name>：要捕获的首部的名称，此名称不区分字符大小写，但建议与它们出如今首部中的格式相同，好比大写首字母。须要注意的是，记录在日志中的是首部对应的值，而非首部名称。
<length>：指定记录首部值时所记录的精确长度，超出的部分将会被忽略。
能够捕获的请求首部的个数没有限制，但每一个捕获最多只能记录64个字符。为了保证同一个frontend中日志格式的统一性，首部捕获仅能在frontend中定义。
capture response header
capture response header <name> len <length>
捕获并记录响应首部，其格式和要点同请求首部。

--------------------------------------------------------------------------------

stats enable
启用基于程序编译时默认设置的统计报告，不能用于“frontend”区段。只要没有另外的其它设定，它们就会使用以下的配置：
- stats uri : /haproxy?stats //url
- stats realm : "HAProxy Statistics" //作认证是提供的信息
- stats auth : no authentication
- stats scope : no restriction //无限制

尽管“stats enable”一条就可以启用统计报告，但仍是建议设定其它全部的参数，以避免其依赖于默认设定而带来非期后果。下面是一配置案例。

123456789 backend public_www
server websrv1 172.16.100.11:80
stats enable
stats hide-version
stats scope .
stats uri /haproxyadmin?stats
stats realm Haproxy\ Statistics
stats auth statsadmin:password
stats auth statsmaster:password

-------------------------------------------------------------------------------------
stats hide-version
启用统计报告并隐藏HAProxy版本报告，不能用于“frontend”区段。默认状况下，统计页面会显示一些有用信息，包括HAProxy的版本号，然而，向全部人公开HAProxy的精确版本号是很是有风险的，由于它能帮助恶意用户快速定位版本的缺陷和漏洞。尽管“stats hide-version”一条就可以启用统计报告，但仍是建议设定其它全部的参数，以避免其依赖于默认设定而带来非期后果。具体请参照“stats enable”一节的说明。
-------------------------------------------------------------------------------------
stats realm
stats realm <realm>
启用统计报告并高精认证领域，不能用于“frontend”区段。haproxy在读取realm时会将其视做一个单词，所以，中间的任何空白字符都必须使用反斜线进行转义。此参数仅在与“stats auth”配置使用时有意义。
<realm>：实现HTTP基本认证时显示在浏览器中的领域名称，用于提示用户输入一个用户名和密码。
尽管“stats realm”一条就可以启用统计报告，但仍是建议设定其它全部的参数，以避免其依赖于默认设定而带来非期后果。具体请参照“stats enable”一节的说明。
-------------------------------------------------------------------------------------
stats scope
stats scope { <name> | "." }
启用统计报告并限定报告的区段，不能用于“frontend”区段。当指定此语句时，统计报告将仅显示其列举出区段的报告信息，全部其它区段的信息将被隐藏。若是须要显示多个区段的统计报告，此语句能够定义屡次。须要注意的是，区段名称检测仅仅是以字符串比较的方式进行，它不会真检测指定的区段是否真正存在。
<name>：能够是一个“listen”、“frontend”或“backend”区段的名称，而“.”则表示stats scope语句所定义的当前区段。
尽管“stats scope”一条就可以启用统计报告，但仍是建议设定其它全部的参数，以避免其依赖于默认设定而带来非期后果。下面是一个配置案例。
backend private_monitoring
stats enable
stats uri /haproxyadmin?stats
stats refresh 10s

----------------------------------------------------------------------------------------
stats auth
stats auth <user>:<passwd>
启用带认证的统计报告功能并受权一个用户账号，其不能用于“frontend”区段。
<user>：受权进行访问的用户名；
<passwd>：此用户的访问密码，明文格式；
此语句将基于默认设定启用统计报告功能，并仅容许其定义的用户访问，其也能够定义屡次以受权多个用户账号。能够结合“stats realm”参数在提示用户认证时给出一个领域说明信息。在使用非法用户访问统计功能时，其将会响应一个“401 Forbidden”页面。其认证方式为HTTP Basic认证，密码传输会以明文方式进行，所以，配置文件中也使用明文方式存储以说明其非保密信息故此不能相同于其它关键性账号的密码。
尽管“stats auth”一条就可以启用统计报告，但仍是建议设定其它全部的参数，以避免其依赖于默认设定而带来非期后果。
---------------------------------------------------------------------------------------
stats admin
stats admin { if | unless } <cond>
在指定的条件知足时启用统计报告页面的管理级别功能，它容许经过web接口启用或禁用服务器，不过，基于安全的角度考虑，统计报告页面应该尽量为只读的。此外，若是启用了HAProxy的多进程模式，启用此管理级别将有可能致使异常行为。
目前来讲，POST请求方法被限制于仅能使用缓冲区减去保留部分以外的空间，所以，服务器列表不能过长，不然，此请求将没法正常工做。所以，建议一次仅调整少数几个服务器。下面是两个案例，第一个限制了仅能在本机打开报告页面时启用管理级别功能，第二个定义了仅容许经过认证的用户使用管理级别功能。
backend stats_localhost
stats enable
stats admin if LOCALHOST
backend stats_auth
stats enable
stats auth haproxyadmin:password
stats admin if TRUE

--------------------------------------------------------------------------------
option logasap
no option logasap
启用或禁用提早将HTTP请求记入日志，不能用于“backend”区段。
默认状况下，HTTP请求是在请求结束时进行记录以便能将其总体传输时长和字节数记入日志，由此，传较大的对象时，其记入日志的时长可能会略有延迟。“option logasap”参数可以在服务器发送complete首部时即时记录日志，只不过，此时将不记录总体传输时长和字节数。此情形下，捕获“Content-Length”响应首部来记录传输的字节数是一个较好选择。下面是一个例子。

listen http_proxy 0.0.0.0:80
mode http
option httplog
option logasap
log 172.16.13.9 local2

--------------------------------------------------------------------------------
option forwardfor
option forwardfor [ except <network> ] [ header <name> ] [ if-none ]
容许在发往服务器的请求首部中插入“X-Forwarded-For”首部。
<network>：可选参数，当指定时，源地址为匹配至此网络中的请求都禁用此功能。
<name>：可选参数，可以使用一个自定义的首部，如“X-Client”来替代“X-Forwarded-For”。有些独特的web服务器的确须要用于一个独特的首部。
if-none：仅在此首部不存在时才将其添加至请求报文问道中。

更多详情见请继续阅读下一页的精彩内容： http://www.linuxidc.com/Linux/2015-06/118968p2.htm