haproxy配置详解
1、haproxy简介
核心功能:
- 负载均衡(Load Balancing)
- 支持四层(TCP)和七层(HTTP/HTTPS)流量分发。
- 提供多种调度算法:轮询(roundrobin)、最少连接(leastconn)、源IP哈希(source)等。
反向代理(Reverse Proxy)
- 隐藏后端服务器细节,对外提供统一入口。
- 支持 SSL 终端(SSL Termination),卸载后端服务器加密负担。
高可用(High Availability)
- 结合 Keepalived 实现双机热备(VRRP 协议)。
流量治理
- 请求过滤、速率限制、连接控制等。
haproxy特点和优点:
- 支持原生SSL,同时支持客户端和服务器的SSL.
- 支持IPv6和UNIX套字节(sockets)
- 支持HTTP Keep-Alive
- 支持HTTP/1.1压缩,节省宽带
- 支持优化健康检测机制(SSL、scripted TCP、check agent…)
- 支持7层负载均衡。
- 可靠性和稳定性非常好。
- 并发连接 40000-50000个,单位时间处理最大请求 20000个,最大数据处理10Gbps.
- 支持8种负载均衡算法,同时支持session保持。
- 支持虚拟主机。
- 支持连接拒绝、全透明代理。
- 拥有服务器状态监控页面。
- 支持ACL(access control list)。
多层级负载均衡
层级 | 协议支持 | 典型场景 |
---|---|---|
四层(L4) | TCP/UDP | 数据库集群、Redis、SSH 跳板 |
七层(L7) | HTTP/HTTPS/HTTP2/3 | Web 应用、API 网关、微服务路由 |
二、实验
1、实验环境的搭建
准备3台主机:
主机1
主机名:haproxy
ip:172.25.254.100
主机2
主机名:RS1
ip:172.25.254.10
主机3
主机名:RS2
ip:172.25.254.20
1)软件包安装
两台RS都安装nginx:
2)关闭火墙
两台RS关闭火墙
3)两台RS设置nginx的index.html内容
设置这个是方便后续测试
4)设置开机自启动(两个都设置)
5)连通测试
haproxy主机curl一下两台RS
关闭火墙
实验环境搭建完毕\
2、haproxy的安装和frontend区
1)安装haproxy
dnf安装
发现系统自带,直接装
2)进入haproxy配置文件 (最基本的负载均衡的调整)
进入编写
进行tab键设置
重启服务
结果:
将option forwardfor注释掉
结果
haproxy软件基本信息
软件安装包: haproxy-2.4.22-3.el9_3.x86_64.rpm启动文件: /lib/systemd/system/haproxy.service主配置目录: /etc/haproxy/主配置文件: /etc/haproxy/haproxy.cfg子配置目录: /etc/haproxy/conf.d
haproxy的基本配置信息
global:全局配置段进程及安全配置相关的参数性能调整相关参数Debug参数
proxies:代理配置段defaults:为frontend, backend, listen提供默认配置frontend:前端,相当于nginx中的server {}backend:后端,相当于nginx中的upstream {}listen:同时拥有前端和后端配置,配置简单,生产推荐使用
3、haproxy全局配置参数 (多进程与多线程)
解释:
nbproc 2 —— 启用多进程,2个进程
cpu-map 1 0 —— 进程和cpu核心绑定防止cpu抖动从而减少系统资源消耗,1表示指定第一个work绑定第一个核心,0表示第一个核心,核心从0开始算(类似数组下标)
cpu-map 2 1 —— 指定第二个work绑定第二个cpu核心
global
log 127.0.0.1 local2 #定义全局的syslog服务器;日志服务器需要开启UDP协议,最多可以定义两个 chroot /var/lib/haproxy #锁定运行目录
pidfile /var/run/haproxy.pid #指定pid文件
maxconn 100000 #指定最大连接数
user haproxy #指定haproxy的运行用户
group haproxy #指定haproxy的运行组
daemon #指定haproxy以守护进程方式运行
# turn on stats unix socket
stats socket /var/lib/haproxy/stats #指定haproxy的套接字文件
nbproc 2 #指定haproxy的work进程数量,默认是1个
cpu-map 1 0 #指定第一个work绑定第一个cpu核心
cpu-map 2 1 #指定第二个work绑定第二个cpu核心 nbthread 2 #指定haproxy的线程数量,默认每个进程一个线程,此参数与nbproc互斥 maxsslconn 100000 #每个haproxy进程ssl最大连接数,用于haproxy配置了证书的场景下 maxconnrate 100 #指定每个客户端每秒建立连接的最大数量
参数 | 说明 |
daemon | 以守护进程(后台)模式运行 |
user group | 指定运行用户/用户组(降权运行) |
chroot | 切换根目录(增强安全性) |
nbproc | 工作进程数(CPU 核数绑定) |
nbthread | 每进程线程数(需启用线程) |
stats socket | 管理套接字路径(动态调整配置) |
重启服务
查看多进程信息
多进程与多线程互斥,只能存在一个
解释:
nbthread —— 启动多线程,线程数为2
查看多线程
thread为2
proxies配置:
主要分为下面4个部分
defaults [<name>] # 默认配置项,针对以下的frontend、backend和lsiten生效,可以多个name也可以没有name
frontend <name> # 前端servername,类似于Nginx的一个虚拟主机 server和LVS服务集群backend <name> # 后端服务器组,等于nginx的upstream和LVS中的RS服务器
listen <name> # 将frontend和backend合并在一起配置,相对于frontend和backend配置更简洁,生产常用注意:name字段只能使用大小写字母,数字,‘-’(dash),'_‘(underscore),'.' (dot)和 ':'(colon),并且严格区分大小写。
1)proxies 配置-defaults
defaults mode http #HAProxy实例使用的连接协议 log global #指定日志地址和记录日志条目的
syslog/rsyslog日志设备 #此处的 global表示使用 global配置段中设定的log值。 、option httplog #日志记录选项,httplog表示记录与 HTTP 会话相关的各种属性值 #包括 HTTP请求、会话状态、连接数、源地 址以及连接时间等 option dontlognull #dontlognull表示不记录空会话连接日志 option http-server-close #等待客户端完整HTTP请求的时间,此处为等 待10s。option forwardfor except 127.0.0.0/8 #透传客户端真实IP至后端web服务器 #在apache配置文件中加入:<br>%{X- Forwarded-For}i #后在webserver中看日志即可看到地址透传 信息 option redispatch #当server Id对应的服务器挂掉后,强制定 向到其他健康的服务器,重新派发 option http-keep-alive #开启与客户端的会话保持 retries 3 #连接后端服务器失败次数timeout http-request 10s #等待客户端请求完全被接收和处理的最长时间 timeout queue 1m #设置删除连接和客户端收到503或服务不可用等提示信息前的等待时间 timeout connect 120s #设置等待服务器连接成功的时间 timeout client 600s #设置允许客户端处于非活动状态,即既不发送数据也不接收数据的时间 timeout server 600s #设置服务器超时时间,即允许服务器处于既不接收也不发送数据的非活动时间 timeout http-keep-alive 60s #session 会话保持超时时间,此时间段内会转发到相同的后端服务器 timeout check 10s #指定后端服务器健康检查的超时时间 maxconn 3000 #承受最大连接数量default-server inter 1000 weight 3 #对后端服务器的检测为1000毫秒一次,weight 3 表示权重
2)proxies 配置-frontend和backend
bind *:80 # 监听端口,即 haproxy 提供web服务的端口,和 lvs 的vip端口类似 mode http # http的7层模式use_backend webserver # 调用的后端为webserverbalance roundrobin # 轮询调用
server 配置
#针对一个server配置check #对指定real进行健康状态检查,如果不加此设置,默认不开启检查,只有check后面没有其它配置也可以启用检查功能#默认对相应的后端服务器IP和端口,利用TCP连接进行周期性健康性检查,注意必须指定端口才能实现健康性检查addr <IP> #可指定的健康状态监测IP,可以是专门的数据网段,减少业务网络的流量port <num> #指定的健康状态监测端口inter <num> #健康状态检查间隔时间,默认2000 msfall <num> #后端服务器从线上转为线下的检查的连续失效次数,默认为3rise <num> #后端服务器从下线恢复上线的检查的连续有效次数,默认为2weight <weight> #默认为1,最大值为256,0(状态为蓝色)表示不参与负载均衡,但仍接受持久连接backup #将后端服务器标记为备份状态,只在所有非备份主机down机时提供服务,类似SorryServerdisabled #将后端服务器标记为不可用状态,即维护状态,除了持久模式#将不再接受连接,状态为深黄色,优雅下线,不再接受新用户的请求redirect prefix http://www.baidu.com/ #将请求临时(302)重定向至其它URL,只适用于http模式maxconn <maxconn> #当前后端server的最大并发连接数
3)proxies 配置-listen
4、HAProxy算法
所有算法在主配置文件配置/etc/haproxy/haproxy.cfg
vim /etc/haproxy/haproxy.cfg ---编辑配置文件
HAProxy通过固定参数 balance 指明对后端服务器的调度算法balance参数可以配置在listen或backend选项中。HAProxy的调度算法分为静态和动态调度算法有些算法可以根据参数在静态和动态算法中相互转换。
静态算法
static-rr
static-rr---基于权重的轮询调度
不支持运行时利用socat进行权重的动态调整(只支持0和1,不支持其它值)不支持端服务器慢启动其后端主机数量没有限制,相当于LVS中的 wrrstatick-rr 按照预先配置的顺序和权重,将客户端请求依次分配给后端服务器。当所有服务器都被分配一次后,算法会从头开始循环
配置文件
运行
first
- 根据服务器在列表中的位置,自上而下进行调度
- 其只会当第一台服务器的连接数达到上限,新请求才会分配给下一台服务
- 其会忽略服务器的权重设置
- 不支持用socat进行动态修改权重,可以设置0和1,可以设置其它值但无效
配置文件
运行
重新配置
运行
动态算法
- 基于后端服务器状态进行调度适当调整,
- 新请求将优先调度至当前负载较低的服务器
- 权重可以在haproxy运行时动态调整无需重启
roundrobin
- 基于权重的轮询动态调度算法,
- 支持权重的运行时调整,不同于lvs中的rr轮训模式,
- HAProxy中的roundrobin支持慢启动(新加的服务器会逐渐增加转发数),
- 其每个后端backend中最多支持4095个real server,
- 支持对real server权重动态调整,
- roundrobin为默认调度算法,此算法使用广泛
配置文件 运行
leastconn
- leastconn加权的最少连接的动态
- 支持权重的运行时调整和慢启动,即:根据当前连接最少的后端服务器而非权重进行优先调度(新客户端连接)
- 比较适合长连接的场景使用,比如:MySQL等场景。
配置文件
运行
其他算法
source
源地址hash,基于用户源地址hash并将请求转发到后端服务器,后续同一个源地址请求将被转发至同一个后端web服务器。此方式当后端服务器数据量发生变化时,会导致很多用户的请求转发至新的后端服务器,默认为静态方式,但是可以通过hash-type支持的选项更改这个算法一般是在不插入Cookie的TCP模式下使用,也可给拒绝会话cookie的客户提供最好的会话粘性,适用于session会话保持但不支持cookie和缓存的场景源地址有两种转发客户端请求到后端服务器的服务器选取计算方式,分别是取模法和一致性hash
这个算法用到的是 map-base 取模法
map-base 取模法map-based:取模法,对source地址进行hash计算,再基于服务器总权重的取模,最终结果决定将此请求转发至对应的后端服务器。此方法是静态的,即不支持在线调整权重,不支持慢启动,可实现对后端服务器均衡调度缺点是当服务器的总权重发生变化时,即有服务器上线或下线,都会因总权重发生变化而导致调度结果整体改变
配置文件
运行
变为动态的配置文件
变为动态的算法
一致性hash一致性哈希,当服务器的总权重发生变化时,对调度结果影响是局部的,不会引起大的变动hash(o)mod n该hash算法是动态的,支持使用 socat等工具进行在线权重调整,支持慢启动
1、后端服务器哈希环点keyA=hash(后端服务器虚拟ip)%(2^32)2、客户机哈希环点key1=hash(client_ip)%(2^32) 得到的值在[0---4294967295]之间,3、将keyA和key1都放在hash环上,将用户请求调度到离key1最近的keyA对应的后端服务器
hash环偏斜问题
增加虚拟服务器IP数量,比如:一个后端服务器根据权重为1生成1000个虚拟IP,再hash。而后端服务器权重为2则生成2000的虚拟IP,再bash,最终在hash环上生成3000个节点,从而解决hash环偏斜问题
uri
基于对用户请求的URI的左半部分或整个uri做hash,再将hash结果对总权重进行取模后根据最终结果将请求转发到后端指定服务器适用于后端是缓存服务器场景默认是静态算法,也可以通过hash-type指定map-based和consistent,来定义使用取模法还是一致性hash注意:此算法基于应用层,所以只支持 mode http ,不支持 mode tcp<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>左半部分:/<path>;<params>整个uri:/<path>;<params>?<query>#<frag>
配置文件
运行
url_param
url_param对用户请求的url中的 params 部分中的一个参数key对应的value值作hash计算,并由服务器总权重相除以后派发至某挑出的服务器,后端搜索同一个数据会被调度到同一个服务器,多用于电商通常用于追踪用户,以确保来自同一个用户的请求始终发往同一个real server如果无没key,将按roundrobin算法
配置文件
运行
hdr
针对用户每个http头部(header)请求中的指定信息做hash,此处由 name 指定的http首部将会被取出并做hash计算,然后由服务器总权重取模以后派发至某挑出的服务器,如果无有效值,则会使用默认的轮询调度。
配置文件
运行
算法总结
#静态static-rr--------->tcp/httpfirst------------->tcp/http#动态roundrobin-------->tcp/httpleastconn--------->tcp/httprandom------------>tcp/http#以下静态和动态取决于hash_type是否consistentsource------------>tcp/httpUri--------------->httpurl_param--------->httphdr--------------->http
各算法使用场景
first #使用较少static-rr #做了session共享的web集群roundrobinrandomleastconn #数据库source#基于客户端公网IP的会话保持Uri--------------->http #缓存服务器,CDN服务商,蓝汛、百度、阿里云、腾讯url_param--------->http #可以实现session保持hdr #基于客户端请求报文头部做下一步处理
5、基于cookie值的会话保持
- 基于 Cookie 值的会话保持(也称为 "粘性会话")是一种常用的负载均衡策略,确保来自同一客户端的请求始终被路由到同一后端服务器,从而维护会话状态的一致性。这种机制特别适用于不支持分布式会话的应用程序
- cookie value:为当前server指定cookie值,实现基于cookie的会话黏性,相对于基于 source 地址hash调度算法对客户端的粒度更精准,但同时也加大了haproxy负载,目前此模式使用较少, 已经被session共享服务器代替
注意:不支持 tcp mode,使用 http mode
目的: 解决有状态应用(Stateful Application)的问题。例如,用户的购物车数据、登录会话信息等通常存储在特定后端服务器的内存或本地缓存中。如果用户的后续请求被负载均衡到不同的服务器,这些状态信息将丢失,导致应用出错。
配置
测试
-b 指定cookie值
可以看到访问cookie值为servera时,被调度到RS1处理; cookie值为serverb时,被调度到RS2处理,与我们在haproxy配置文件里配置的一致。
6、HAProxy状态页
HAProxy 的状态页(Stats Page) 是实时监控负载均衡集群的核心工具,通过 Web 页面展示关键性能指标和后端节点状态。
状态页配置项
stats enable #基于默认的参数启用stats pagestats hide-version #将状态页中haproxy版本隐藏stats refresh <delay> #设定自动刷新时间间隔,默认不自动刷新stats uri <prefix> #自定义stats page uri,默认值:/haproxy?statsstats auth <user>:<passwd> #认证时的账号和密码,可定义多个用户,每行指定一个用户#默认:no authenticationstats admin { if | unless } <cond> #启用stats page中的管理功能
实验配置
测试
加上stats refresh后面加上数字表示自动刷新的间隔
#pid为当前pid号,process为当前进程号,nbproc和nbthread为一共多少进程和每个进程多少个线程
pid = 27134 (process #1, nbproc = 1, nbthread = 1) #启动了多长时间
uptime = 0d 0h00m04s #系统资源限制:内存/最大打开文件数/
system limits: memmax = unlimited; ulimit-n = 200029 #最大socket连接数/单进程最大连接数/最大管道数maxpipes
maxsock = 200029; maxconn = 100000; maxpipes = 0 #当前连接数/当前管道数/当前连接速率
current conns = 2; current pipes = 0/0; conn rate = 2/sec; bit rate = 0.000 kbps#运行的任务/当前空闲率
Running tasks: 1/14; idle = 100 % active UP: #在线服务器
backup UP: #标记为backup的服务器
active UP, going down: #监测未通过正在进入down过程
backup UP, going down: #备份服务器正在进入down过程
active DOWN, going up: #down的服务器正在进入up过程
backup DOWN, going up: #备份服务器正在进入up过程
active or backup DOWN: #在线的服务器或者是backup的服务器已经转换成了down状态
not checked: #标记为不监测的服务器 #active或者backup服务器人为下线的
active or backup DOWN for maintenance (MAINT) #active或者backup被人为软下线(人为将weight改成0)
active or backup SOFT STOPPED for maintenance
backend server信息
session rate(每秒的连接会话信息):Errors(错误统计信息):cur:每秒的当前会话数量 :Req:错误请求量max:每秒新的最大会话数量conn:错误链接量limit:每秒新的会话限制量Resp:错误响应量sessions(会话信息):Warnings(警告统计信息):cur:当前会话量Retr:重新尝试次数max:最大会话量Redis:再次发送次数limit: 限制会话量Total:总共会话量Server(real server信息):LBTot:选中一台服务器所用的总时间Status:后端机的状态,包括UP和DOWNLast:和服务器的持续连接时间LastChk:持续检查后端服务器的时间Wght:权重Bytes(流量统计):Act:活动链接数量In:网络的字节输入总量Bck:备份的服务器数量Out:网络的字节输出总量Chk:心跳检测时间Dwn:后端服务器连接后都是DOWN的数量Denied(拒绝统计信息):Dwntme:总的downtime时间Req:拒绝请求量Thrtle:server 状态Resp:拒绝回复量
7、IP透传
HAProxy 的 IP 透传 是指将原始客户端的真实 IP 地址传递给后端服务器,而不是让后端服务器只看到 HAProxy 自身的 IP 地址。这对于后端应用至关重要,因为它需要知道真实的客户端信息来进行日志记录、访问控制、地理定位、速率限制、安全审计等操作。
HAProxy 本身作为反向代理或负载均衡器,是客户端与后端服务器之间的中间节点。默认情况下,后端服务器看到的 TCP 连接源 IP 地址就是 HAProxy 的 IP 地址。
7层ip透传
当haproxy工作在七层的时候,也可以透传客户端真实IP至后端服务器
进入haproxy配置文件
开启Listen就把frontend和backend关了
4层ip透传
1)未开启时
未开启4层ip透传时的各种配置:
haproxy.cfg
两台RS都要配置
未开启4层ip透传时的访问测试极其日志:
访问测试
日志查看
在一台RS上查看nginx日志会发现,其真实访问源地址是看不到的(红框为-)
开启时
开启4层ip透传时的各种配置:
nginx.conf(两台RS都要配置)
开启4层ip透传时的访问测试极其日志:
访问测试
查看日志nginx
这样就能看到源ip地址
8、ACL
HAProxy 的 ACL 是其核心功能之一,用于定义复杂的流量匹配规则,实现基于请求内容(如 URL、Header、IP、路径等)的智能路由、过滤或决策。
前置要求
将proxy_protocol去掉
Client里做解析
先在Client里做域名解析,不然后续测试访问不了
解析在/etc/hosts做
这样就有解析了
基本配置
开启frontend、backend
其余的listen注释掉
ACL配置选项
基本语法
用acl来定义或声明一个aclacl <aclname> <criterion> [flags] [operator] [<value>]acl 名称 匹配规范 匹配模式 具体操作符 操作对象类型
ACL-Name 名称
ACL-criterion 匹配规则
路径匹配((URL Path)
条件类型 | 说明 |
path | 精确匹配路径 |
path_beg | 路径开头匹配 |
path_end | 路径结尾匹配 |
path_sub | 路径包含子串 |
path_dir | 包含目录匹配 |
path_reg | 正则表达式匹配 |
path_len | 路径长度比较 |
域名/主机头匹配 (Host)
条件类型 | 说明 |
hdr(host) | 精确匹配 Host 头 |
hdr_reg(host) | 正则匹配 Host |
hdr_dom | 同 hdr(host) (旧式写法) |
HTTP头部匹配
语法 | 说明 |
hdr(<name>) | 检查头部存在/值 |
hdr_sub(<name>) | 头部包含子串 |
hdr_reg(<name>) | 正则匹配头部值 |
hdr_cnt(<name>) | 头部数量检查 |
hdr_beg(<name>) | 头部开头匹配 |
HTTP方法/版本
条件类型 | 说明 |
method | HTTP方法匹配 |
method_len | 方法长度比较 |
ver | HTTP版本 |
标志项详解
标志 | 说明 | 示例 |
-i | 忽略大小写 | hdr(host) -i EXAMPLE.COM |
-m | 匹配模式 | -m str :字符串匹配-m beg :开头匹配-m end :结尾匹配-m sub :子串匹配-m reg :正则匹配-m found :存在即匹配 |
-f | 从文件加载 | src -f /path/to/ip.list |
-n | 数值比较 | path_len -n gt 100 |
ACL-operator 具体操作符
整数比较:eq、ge、gt、le、lt字符比较:
- exact match (-m str) :字符串必须完全匹配模式
- substring match (-m sub) :在提取的字符串中查找模式,如果其中任何一个被发现,ACL将匹配
- prefix match (-m beg) :在提取的字符串首部中查找模式,如果其中任何一个被发现,ACL将匹配
- suffix match (-m end) :将模式与提取字符串的尾部进行比较,如果其中任何一个匹配,则ACL进行匹配
- subdir match (-m dir) :查看提取出来的用斜线分隔(“/")的字符串,如其中任一个匹配,则ACL进行匹配
- domain match (-m dom) :查找提取的用点(“.")分隔字符串,如果其中任何一个匹配,则ACL进行匹配
ACL-value 操作对象
The ACL engine can match these types against patterns of the following types :
- Boolean #布尔值
- integer or integer range #整数或整数范围,比如用于匹配端口范围
- IP address / network #IP地址或IP范围, 192.168.0.1 ,192.168.0.1/24
- string--> www.timinglee.org
exact #精确比较
substring #子串
suffix #后缀比较
prefix #前缀比较
subdir #路径, /wp-includes/js/jquery/jquery.js
domain #域名,www.timinglee.org
- regular expression #正则表达式
- hex block #16进制
ACL实验
访问
实验——域名匹配
配置
访问
9、自定义错误页面
概念
在 HAProxy 中,自定义报错页面是一项关键功能,它允许你替换 HAProxy 生成的默认错误响应(通常是简短、技术性的纯文本或 JSON),为用户或客户端提供更友好、更专业、更具品牌特色或包含更多指导信息的 HTML 错误页面。
实验
建立自定义报错文件
测试
关闭两个RS的nginx,模拟服务断开
然后浏览器访问ip,就能看到自定义报错界面了
10、证书
(1)证书制作
所有主机都关闭SELinux(命令setenforce 0)
按照提示来输入名字那些
之后将key和crt一起放到.pem里
这样证书就生成完毕了
进haproxy配置文件配置
访问