HAProxy 简介及配置
一、HAProxy 简介
HAProxy 是由法国人 Willy Tarreau 开发的开源软件,专为处理高并发场景设计,能支持 10000 以上客户端同时连接,是高性能的 TCP 和 HTTP 负载均衡器。它提供高可用性、负载均衡以及基于 TCP 和 HTTP 的应用代理,支持虚拟主机,是免费、快速且可靠的负载均衡解决方案,尤其适合处理高负载站点的七层数据请求,还能屏蔽内部真实服务器,抵御攻击。
官网:http://www.haproxy.com
二、HAProxy 特点和优点
- 支持原生 SSL,同时支持客户端和服务器的 SSL。
 - 支持 IPv6 和 UNIX 套字节(sockets)。
 - 支持 HTTP Keep-Alive。
 - 支持 HTTP/1.1 压缩,节省宽带。
 - 支持优化健康检测机制(SSL、scripted TCP、check agent 等)。
 - 支持 7 层负载均衡。
 - 可靠性和稳定性非常好。
 - 并发连接 40000-50000 个,单位时间处理最大请求 20000 个,最大数据处理 10Gbps。
 - 支持 8 种负载均衡算法,同时支持 session 保持。
 - 支持虚拟主机。
 - 支持连接拒绝、全透明代理。
 - 拥有服务器状态监控页面。
 - 支持 ACL(access control list)。
 
三、HAProxy 保持会话的三种解决方法
为确保同一客户端访问服务器能保持会话,HAProxy 有以下三种解决方法:
- 通过客户端 IP 进行 Hash 计算并保存,使相同 IP 访问代理服务器时转发给固定的真实服务器。
 - 依靠真实服务器发送给客户端的 Cookie 信息进行会话保持。
 - 保存真实服务器的 Session 以及服务器标识,实现会话保持。(HAProxy 仅要求后端服务器网络联通,无需像 LVS 那样进行繁琐的 ARP 配置)
 
四、HAProxy 的 8 种负载均衡算法
- RR(Round Robin):轮询调度,将请求按顺序轮流分配给后端节点。例如三个节点 A、B、C,第一个用户到 A,第二个到 B,第三个到 C,第四个再到 A,以此类推。
 - LC(Least Connections):最小连接数算法,根据后端节点连接数动态分配请求,将新请求分配给连接数最小的节点。
 - SH(Source Hashing):基于来源访问调度算法,适用于服务端有 Session 会话记录的场景,可基于来源的 IP、Cookie 等进行集群调度,能实现会话保持,但可能因部分 IP 访问量大导致负载不均衡。
 - uri(资源标识符):根据请求的 URI 调度,适用于 CDN(内容分发网络)。
 - url_param(资源定位符):根据 HTTP 请求头锁定每次 HTTP 请求。
 - rdp—cookie(name):根据 cookie(name)锁定并哈希每次 TCP 请求。
 - source:根据请求的源 IP,类似 Nginx 的 IP hash 机制。
 - static-rr:根据权重进行轮询。
 
五、HAProxy 主要工作模式
- tcp 模式:在客户端和服务器之间建立全双工连接,不处理七层报文,通常用于 SSL、SSH、SMTP 等应用层。
 - http 模式(一般使用):转发客户端请求给后端服务器前会深度分析,拒绝所有不与 RFC 格式兼容的请求。
 
六、HAProxy 安装
6.1 通过 tar.gz 安装
- 准备 HAProxy 安装包(如 haproxy-2.9.5.tar.gz),传到 /opt 目录。
 - 解压到 /usr/local/src:
 
bash
tar -zxvf haproxy-2.9.5.tar.gz -C  /usr/local/src
cd /usr/local/src/haproxy-2.9.5/
 
- 查询系统内核版本:
 
bash
uname -r
 
- 编译,centos6.X 用 TARGET=linux26,centos7.x 用 linux31:
 
bash
make TARGET=linux31 PREFIX=/usr/local/haproxy [ARCH=x86_64]
 
- 安装到 /usr/local/haproxy 目录:
 
bash
make install PREFIX=/usr/local/haproxy
 
- 创建目录和配置文件:
 
bash
mkdir -p /usr/data/haproxy/
vim /usr/local/haproxy/haproxy.cfg
 
6.2 通过 yum 安装
bash
yum -y install haproxy
 
七、HAProxy 配置文件参数
HAProxy 配置文件 haproxy.cfg 的默认地址为 /etc/haproxy/haproxy.cfg,由 global 和 proxies 两大部分组成。
7.1 global 全局配置
包含进程及安全配置、性能调整、Debug 等相关参数,例如:
- chroot:锁定运行目录
 - deamon:以守护进程运行
 - user、group、uid、gid:运行 haproxy 的用户身份
 - nbproc:开启的 haproxy 进程数,与 CPU 保持一致
 - maxconn:每个 haproxy 进程的最大并发连接数
 - log:定义全局的 syslog 服务器
 
示例:
bash
global chroot /var/haproxy             # 锁定运行目录uid 99                          # 所属运行的用户uid gid 99                          # 所属运行的用户组 daemon                          # 守护进程。以后台形式运行haproxy nbproc 1                        # haproxy进程数,与CPU保持一致pidfile /var/run/haproxy.pid    # haproxy的pid存放路径ulimit-n 65535	                # ulimit的数量限制maxconn 20480                   # 默认最大连接数 log 127.0.0.1 local0            # 日志输出配置log 127.0.0.1 local1 notice   	# notice为日志级别
 
7.2 proxies 代理配置
主要包括 defaults、frontend、backend、listen 四部分。
7.2.1 defaults
为 frontend、backend、listen 提供默认配置,例如:
- option redispatch:当服务器挂掉后,强制定向到其他健康服务器
 - mode http:默认工作类型
 - timeout connect:客户端请求到后端 server 的最长连接等待时间
 - balance roundrobin:默认的负载均衡方式
 
示例:
bash
defaults log global                      # 应用全局日志配置mode http                       # 处理类别为http(7层)maxconn 20480                   # 最大连接数 option httplog                  # 日志类别为http日志格式 option httpclose                # 每次请求完毕后主动关闭http通道 option dontlognull              # 不记录健康检查的日志信息 option forwardfor               # 让后端服务器获得客户端真实ipoption redispatch               # 服务器挂掉后强制定向到其他健康服务器option abortonclose             # 服务器负载高时结束久等连接 stats refresh 30                # 统计页面刷新间隔 retries 3                       # 检查节点服务器失败次数balance roundrobin              # 负载均衡方式为轮询contimeout 5000                 # 连接超时时间clitimeout 50000                # 客户端超时时间srvtimeout 50000                # 服务器超时时间timeout check 2000              # 心跳检测超时时间
 
7.2.2 frontend
指定接收客户端侦听套接字设置,类似 Nginx 的 server {},可定义 ACL 策略进行匹配操作。
示例:
bash
frontend http_80_in bind 0.0.0.0:80      # 监听端口mode http            # http的7层模式 log global           # 应用全局的日志配置 option httplog       # 启用http的log option httpclose     # 每次请求完毕后主动关闭http通道 option forwardfor    # 让后端服务器获得客户端真实IP# acl策略配置acl itnihao_web hdr_reg(host) -i ^(www.itnihao.cn|ww1.itnihao.cn)$    acl itnihao_blog hdr_dom(host) -i blog.itnihao.cn# acl策略匹配相应 use_backend  server_web  if itnihao_web use_backend  server_blog if itnihao_blog default_backend server_bbs  # 以上都不满足时使用默认backend
 
7.2.3 backend
指定将连接请求转发至后端服务器的相关设置,类似 Nginx 的 upstream {}。
示例:
bash
backend server_web mode http                         # http的7层模式 balance roundrobin                # 负载均衡方式为轮询cookie SERVERID                   # 允许插入serverid到cookie中option httpchk GET /index.html    # 心跳检测的文件 server web1 192.168.16.2:80 cookie web1 check inter 1500 rise 3 fall 3 weight 1     server web2 192.168.16.3:80 cookie web2 check inter 1500 rise 3 fall 3 weight 2
 
7.2.4 listen
同时拥有前端和后端配置,只对 TCP 有效,可用于配置监控页面等。
示例(监控页面配置):
bash
listen admin_status                bind 0.0.0.0:65532             # 监听端口 mode http                      # http的7层网络模式 log 127.0.0.1 local3 err       # 错误日志记录 stats refresh 5s               # 每隔5秒自动刷新监控页面 stats uri /admin?stats         # 监控页面的url stats realm itnihao\ itnihao   # 监控页面的提示信息 stats auth admin:admin         # 监控页面的用户和密码stats auth admin1:admin1       # 另一个用户和密码stats hide-version             # 隐藏HAproxy版本信息  stats admin if TRUE            # 手工启用/禁用后端服务器
 
7.3 完整配置文件示例
bash
globallog /dev/log    local0 infolog /dev/log    local0 noticemaxconn 4096uid 99gid 99daemondefaultslog globalmode    httpoption  httplogretries 3maxconn 4096contimeout  5000clitimeout  50000srvtimeout  50000listen  webcluster 0.0.0.0:80option  httpchk GET /index.htmlbalance roundrobinserver  inst1 192.168.200.103:80 check inter 2000 fall 3server  inst2 192.168.200.104:80 check inter 2000 fall 3listen admin_statsbind 0.0.0.0:8000mode httpoption httplogmaxconn 100stats refresh 30sstats uri /statsstats realm Crushlinux\ Haproxystats auth  admin:adminstats hide-version
 
八、服务自启动脚本配置
bash
cp /usr/src/haproxy-2.9.5/examples/haproxy.init /etc/init.d/haproxy
ln -s /usr/local/sbin/haproxy /usr/sbin/haproxy
chmod +x /etc/init.d/haproxy 
/etc/init.d/haproxy start# 将haproxy服务交由systemd管理
chkconfig --add /etc/init.d/haproxy
# 启动
systemctl start haproxy
# 设置开机自启
chkconfig --level 35 haproxy on
 
九、Haproxy 日志配置
Haproxy 日志默认输出到系统 syslog,为便于管理可单独配置:
- 修改 haproxy.cfg 的 global 选项:
 
bash
log /dev/log    local0 info
log /dev/log    local0 notice
 
- 重启 haproxy:
 
bash
service haproxy restart
 
- 在 /etc/rsyslog.d/ 下创建 haproxy.conf:
 
bash
if ($programname == 'haproxy' and $syslogserverity-text == 'info') then -/var/log/haproxy/haproxy-info.log &~
if ($programname == 'haproxy' and $syslogserverity-text == 'notice') then -/var/log/haproxy/haproxy-notice.log &~
 
- 重启 rsyslog 服务:
 
bash
service rsyslog restart
 
十、状态统计功能测试
仅七层可配置状态统计功能:
bash
listen stats # 定义监控页面    mode httpoption httplogbind *:1080                   # 绑定端口1080    stats refresh 30s             # 每30秒更新监控数据    stats uri /stats              # 访问监控页面的uri    stats realm HAProxy\ Stats    # 监控页面的认证提示    stats auth admin:admin        # 监控页面的用户名和密码
 
配置后,可通过访问对应端口和 URI 查看监控页面。
