haproxy 搭建web群集
一 案例分析
1.案例概述
目录
一 案例分析
1.案例概述
2.案例前置知识点
2.1 HTTP 请求
2.2 负载均衡常用调度算法
2.3 常见的web群集调度器
二 案例实施
1.安装网站
(1)关闭Linux防火墙
(2)安装网站httpd服务器
(3)添加网页
(4)最后验证网页
三.安装haproxy
1.haproxy 服务器配置
(1)建议haproxy的配置文件
(2)修改haproxy配置文件
4.测试 Web 群集
(1)测试高性能在客户端使用浏览器打开 http://192.168.10.103/test.html,浏览器显示信息如图 4.4 所示。
5.haproxy 的日志
(1)修改haproxy 配置文件置文件,将)将原有的配置更改为以下配置:
(2)配置Rsyslog服务
(3)重启haproxy 和 Rsyslog
(4)测试日志信息
6.haproxy的参数优化
一 案例分析
1.案例概述
Haproxy 是目前比较流行的一种群集调度工具,同类群集调度工具有很多,如 LVS和Nginx。相比较而言,LVS性能最好,但是搭建相对复杂;Nginx的upstream 模块支持群集功能,但是对群集节点健康检查功能不强,高并发性能没有 Haproxy 好。Haproxy 官方网站是http://www.haproxy.org/
2.案例前置知识点
2.1 HTTP 请求
通过 URL 访问网站使用的协议是HTTP 协议,此类请求一般称为 HTTP 请求。HTTP请求的方式分为 GET 方式和 POST 方式。当使用浏览器访问某一个URL,会根据请求 URL 返回状态码,通常正常的状态码为2×X、3××(如 200、301),如果出现异常会返回4××、5××(如400、500)。
例如,访问 http://www.test.com/a.php?Id=123,就是一个GET 请求,如果访问正常,会从服务器的日志中获取 200 状态码。假如此请求使用 POST 方式,那么传递给 a.php的Id参数依旧是123,但是浏览器的URL 将不会显示后面的 Id=123 字样,因此表单类或者有用户名、密码等内容提交时建议使用POST 方式。不管使用哪种方式,最终 a.php 获取的值是一样的。
2.2 负载均衡常用调度算法
LVS、Haproxy、Nginx 最常用的调度算法有三种,如下所述。
(1)RR(Round Robin)。RR 算法是最简单最常用的一种算法,即轮询调度。
例如,有三个节点A、B、C,第一个用户访问会被指派到节点A,第二个用户访
问会被指派到节点 B,第三个用户访问会被指派到节点C,第四个用户访问继续
指派到节点 A,轮询分配访问请求实现负载均衡效果。此算法还有一种加权轮询,
即根据每个节点的权重轮询分配访问请求。LC (Least Connections)LC 算法即最小连接数算法,根据后端的节点连接数大
小动态分配前端请求。例如,有三个节点A、B、C,各节点的连接数分别为A:
4、B:5、C:
6,此时如果有第一个用户连接请求,会被指派到A上,连接数变为A:5、B:
5、C:6;第二个用户请求会继续分配到A上,连接数变为A:6、B:5、C:6;
再有新的请求会分配给 B,每次将新的请求指派给连接数最小的客户端。由于实
际情况下A、B、C 的连接数会动态释放,很难会出现一样连接数的情况,因此
此算法相比较 rr 算法有很大改进,是目前用到比较多的一种算法。(3)SH(Source Hashing)。SH 即基于来源访问调度算法,此算法用于一些有
Session会话记录在服务器端的场景,可以基于来源的 IP、Cookie 等做群集调
度。例如,使用基于源 IP 的群集调度算法,有三个节点A、B、C,第一个用户
第一次访问被指派到了A,第二个用户第一次访问被指派到了B,当第一个用户
第二次访问时会被继续指派到A,第二个用户第二次访问时依旧会被指派到 B,
只要负载均衡调度器不重启,第一个用户访问都会被指派到A,第二个用户访问
都会被指派到 B,实现群集的调度。此调度算法好处是实现会话保持,但某些 IP
访问量非常大时会引起负载不均衡,部分节点访问量超大,影响业务使用
2.3 常见的web群集调度器
目前,常见的Web 群集调度器分为软件和硬件。软件通常使用开源的 LVS、Haproxy、Nginx,硬件一般使用比较多的是F5。也有很多人使用国内的一些品,如梭子鱼、绿盟等。
二 案例实施
1.安装网站
(1)关闭Linux防火墙
setenforce 0systemctl stop firewalld
(2)安装网站httpd服务器
dnf -y install httpd
(3)添加网页
cd /var/www/html/lsecho"test1.">var/www/html/index.html
(4)最后验证网页
curl 192。168.10.102
三.安装haproxy
.在 Haproxy 服务器使用 dnf 安装 haproxy-2.9.5-8.oe2403sp1.x86_64。
dnf -y install haproxy
1.haproxy 服务器配置
(1)建议haproxy的配置文件
cd vim /etc/haproxy/haproxy.cfggloballog 127.0.0.1 1oca12 maxconn 4000user haproxygroup haproxydefaults
log global
mode http
option httplogretries 3maxconn 3000timeout connect 5stimeout client 1mtimeout server 1mlisten webclusterbind 0.0.0.0:80option httpchk GET /index. htmlbalance roundrobin //负载均衡调度算法使用轮询算法server inst1 192.168.10.102:80 check inter 2000 fall 3 server inst2 192. 168. 10. 103:80 check inter 2000 fall 3
解释:
Haproxy 配置项介绍:
Haproxy 配置文件通常分为三个部分,即 global、defaults 和 listen。global 为全局配置,defaults 为默认配置,listen 为应用组件配置。
global 配置项通常有下面配置参数,以示例参数说明如下。
log 127.0.0.1 loca12 配置日志记录,1oca12 为日志设备,默认存放到系统志 maxconn 4000 最大连接数 user haproxy 用户 group haproxy 用户组
defaults 配置项配置默认参数,一般会被应用组件继承,如果在应用组件中没有特别声明,将按照默认配置参数设置。
log global 定义日志为 global 配置中的日志定义 mode http 模式为 http option httplog 采用 http 日志格式记录日志 maxconn 3000 //最大连接数 timeout connect 5s 连接超时时间 timeout client 1m 客户端超时时间 timeout server 1m 服务器超 时时间
retries 3 检查节点服务器失败次数,连续达到三次失败,则认为节点不可用 maxconn 3000 //最大连接数
(2)修改haproxy配置文件
根据目前的群集设计,将haproxy.cfg 配置文件的内容修改如下。
vim /etc/haproxy/haproxy.cfggloballog 127.0.0.1 local2chroot /var/lib/haproxy pidfile /var/run/haproxy. piduser haproxygroup haproxydaemonmaxconn 4000 defaultsmode httplog globaloption httplogoption dontlognull retries 3timeout http-request 5stimeout queue 1mtimeout connect 5stimeout client 1mtimeout server 1mtimeout http-keep-alive 5stimeout check 5smaxconn 3000listen webclusterbind 0.0.0.0:80option httpchk GET / index. htmlbalance roundrobin
server inst1 192. 168. 10. 102:80 check inter 2000 fall 3server inst2 192. 168. 10. 103:80 check inter 2000 fall 3
4.测试 Web 群集
通过上面的步骤,已经搭建完成Haproxy的Web 群集,接下来需要验证群集是否工作正常。一个群集一般需要具备两个特性,第一个是高性能,第二个是高可用。
(1)测试高性能
在客户端使用浏览器打开 http://192.168.10.103/test.html,浏览器显示信息如图 4.4 所示。
5.haproxy 的日志
Haproxy 的日志默认输出到系统的 syslog中,查看起来不是非常方便,为了更好地管理Haproxy 的日志,在生产环境中一般单独定义出来,定义的方法如下所述。
(1)修改haproxy 配置文件置文件,将)将原有的配置更改为以下配置:
vim /etc/haproxy/haproxy.cfggloballog 127.0.0.1 local2log 127.0.0.1 local3chroot /var/lib/haproxy pidfile /var/run/haproxy. piduser haproxygroup haproxydaemonmaxconn 4000
(2)配置Rsyslog服务
vim /etc/rsyslog.d/haproxy.conf$ModLoad imudp$UDPServerRun 514local3.* /var/log/haproxy.log&~
(3)重启haproxy 和 Rsyslog
systemctl restart haproxysystemctl restart rsyslog
(4)测试日志信息
在客户端访问http://192.168.10.103/test.html后,可以使用tail -f/var/log/haproxy.log 即时查看 Haproxy 的访问请求日志信息
cat /var/log/haproxy. logMar 25 12:06:59 localhost haproxy[2410]: 192. 168. 10. 1:17667 [25/Mar/2025:12:06:59.566] webcluster webcluster/inst1 0/0/1/5/6 200 230 - - -------1/1/0/0/0 0/0 "GET / HTTP/1.1"
6.haproxy的参数优化
关于 Haproxy 的参数优化,以下列举了几个关键的参数,并对各参数的生产环境的优化 建议做了说明,如表 4-2 所示。
参数 参数说明 优化建议 maxconn 最大连接数 此参数根据应用的实际使用情况进行调整,推荐使用
10240,同时“defaults”中的最大连接数的值不能
超过“global”段中的定义daemon 守护进程模式 Haproxy 可以使用非守护进程模式启动,生产环境建
议使用守护进程模式启动nbproc 负载均衡的并发进程数 建议与当前服务器CPU核数相等或为其2倍 tetrles 重试次数 此参数主要用于对群集节点的检查,如果节点多,且
并发量大,设置为2次或3次;在服务器节点不多的
情况下,可以设置5次或6次option
http-server-close主动关闭http请求选项 建议在生产环境中使用此选项,避免由于timeout时
间设置过长导致http连接堆积timeout
http-keep-alive长连接超时时间 此选项设置长连接超时时间,具体参考应用自身特点
设置,可以设置为10stimeout http-request http 请求超时时间 建议将此时间设置为5~10s,增加http接释放速度 timeout client 客户端超时时间 如果访问量过大,节点响应慢,可以将此时间设置短
一些,建议设置为1min左右就可以了