当前位置: 首页 > news >正文

LVS(Linux virual server)基础概念详解

LVS(Linux Virtual Server)负载均衡技术详解

一、实验环境

主机名

角色

server1

调度器(VS)

server2

真实服务器(RS)

server3

真实服务器(RS)

server4

测试机

二、集群和分布式系统

1. 系统性能扩展方式

  • ​Scale UP​​:垂直扩展,增强单机性能

  • ​Scale Out​​:水平扩展,增加设备数量,需要解决调度分配问题

2. 集群(Cluster)类型

类型

描述

关键指标

LB (负载均衡)

多个主机分担访问流量

吞吐量

HA (高可用)

避免单点故障(SPOF)

可用性(A=MTBF/(MTBF+MTTR))

HPC (高性能计算)

国家战略资源

计算能力

​SLA(服务等级协议)​​:通常用"几个9"表示可用性水平,如99.9%、99.99%等

3. 分布式系统

  • ​分布式存储​​:Ceph, GlusterFS, FastDFS

  • ​分布式计算​​:Hadoop, Spark

  • ​分布式应用​​:分布式应用-服务按照功能拆分,使用微服务

  • 分布式静态资源--静态资源放在不同的存储集群上

  • 分布式数据和存储--使用key-value缓存系统 分布式计算--对特殊业务使用分布式计算,比如Hadoop集群

  • 微服务架构

4. 集群与分布式对比

集群:同一个业务系统,部署在多台服务器上,集群中,每一台服务器实现的功能没有差别,数据 和代码都是一样的

分布式:一个业务被拆成多个子业务,或者本身就是不同的业务,部署在多台服务器上。分布式 中,每一台服务器实现的功能是有差别的,数据和代码也是不一样的,分布式每台服务器功能加起 来,才是完整的业务

分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数 来提升效率

对于大型网站,访问用户很多,实现一个群集,在前面部署一个负载均衡服务器,后面几台服务器 完成同一业务。如果有用户进行相应业务访问时,负载均衡器根据后端哪台服务器的负载情况,决 定由给哪一台去完成响应,并且台服务器垮了,其它的服务器可以顶上来。分布式的每一个节点, 都完成不同的业务,如果一个节点垮了,那这个业务可能就会失败

特性

集群

分布式

业务

相同业务多副本

业务拆分

数据

相同

不同

目标

提高并发处理能力

缩短单个任务执行时间

三、LVS原理与工作模式

1. LVS简介

  • ​LVS​​:Linux Virtual Server,Linux内核集成的四层负载均衡器,负载调度器,内核集成,章文嵩,阿里的四层SLB(Server LoadBalance)是基 于LVS+keepalived实现

LVS 官网: http://www.linuxvirtualserver.org/

lvs集群体系结构:

  • ​关键术语​​:

    • VS(Virtual Server):调度器

    • RS(Real Server):真实服务器

    • VIP(Virtual IP):对外服务IP

    • DIP(Director IP):调度器内网IP

    • RIP(Real IP):真实服务器IP

2. LVS工作模式对比

lvs-nat:
修改请求报文的目标IP,多目标IP的DNAT
lvs-dr:  操纵封装新的MAC地址
lvs-tun:
在原请求IP报文之外新加一个IP首部
lvs-fullnat:   修改请求报文的源和目标

模式

特点

适用场景

性能

配置复杂度

NAT

修改目标IP,请求响应都经VS

小规模,RS任意OS

中等

简单

DR

修改MAC地址,响应直接返回

高性能要求

中等

TUN

IP隧道封装,支持跨网络

异地部署

复杂

FULLNAT

修改源和目标IP

特殊场景

复杂

3. 各模式详细说明

3.1 NAT模式
  • ​特点​​:

    • 本质是多目标IP的DNAT,通过将请求报文中的目标地址和目标端口修改为某挑出的RS的RIP和 PORT实现转发

    • RIP和DIP应在同一个IP网络,且应使用私网地址;RS的网关要指向DIP

    • 请求报文和响应报文都必须经由Director转发,Director易于成为系统瓶颈

    • 支持端口映射,可修改请求报文的目标PORT

    • VS必须是Linux系统,RS可以是任意系统

nat模式数据逻辑

1.客户端发送访问请求,请求数据包中含有请求来源(cip),访问目标地址(VIP)访问目标端口 (9000port)

2.VS服务器接收到访问请求做DNAT把请求数据包中的目的地由VIP换成RS的RIP和相应端口 3.RS1相应请求,发送响应数据包,包中的相应保温为数据来源(RIP1)响应目标(CIP)相应端口 (9000port)

4.VS服务器接收到响应数据包,改变包中的数据来源(RIP1-->VIP),响应目标端口(9000-->80) 5.VS服务器把修改过报文的响应数据包回传给客户端 6.lvs的NAT模式接收和返回客户端数据包时都要经过lvs的调度机,所以lvs的调度机容易阻塞

客户请求到达vip后进入PREROUTING,在没有ipvs的时候因该进入本机INPUT,当IPVS存在后访问请求在通 过PREROUTING后被ipvs结果并作nat转发 因为ipvs的作用点是在PREROUTING和INPUT链之间,所以如果在prerouting中设定规则会干扰ipvs的工 作。所以在做lvs时要把iptables的火墙策略全清理掉。

3.2 DR模式

DR:Direct Routing,直接路由,LVS默认模式,应用最广泛,通过为请求报文重新封装一个MAC首部进行 转发,源MAC是DIP所在的接口的MAC,目标MAC是某挑选出的RS的RIP所在接口的MAC地址;源 IP/PORT,以及目标IP/PORT均保持不变

  • DR模式数逻辑

在DR模式中,RS接收到访问请求后不需要回传给VS调度器,直接把回传数据发送给client,所以RS和vs 上都要有vip

DR模式数据传输过程

1.客户端发送数据帧给vs调度主机帧中内容为客户端IP+客户端的MAC+VIP+VIP的MAC

2.VS调度主机接收到数据帧后把帧中的VIP的MAC该为RS1的MAC,此时帧中的数据为客户端IP+客户端 的MAC+VIP+RS1的MAC

3.RS1得到2中的数据包做出响应回传数据包,数据包中的内容为VIP+RS1的MAC+客户端IP+客户端IP的 MAC

DR模式的特点

1.Director和各RS都配置有VIP

2.确保前端路由器将目标IP为VIP的请求报文发往Director

3.在前端网关做静态绑定VIP和Director的MAC地址

        在RS上使用arptables工具

arptables -A IN -d $VIP -j DROP
arptables -A OUT -s $VIP -j mangle --mangle-ip-s $RIP
        在RS上修改内核参数以限制arp通告及应答级别
/proc/sys/net/ipv4/conf/all/arp_ignore
/proc/sys/net/ipv4/conf/all/arp_announce
4.RS的RIP可以使用私网地址,也可以是公网地址;RIP与DIP在同一IP网络;
5.RIP的网关不能指向DIP,以确保响应报文不会经由Director
6.RS和Director要在同一个物理网络
7.请求报文要经由Director,但响应报文不经由Director,而由RS直接发往Client
8.不支持端口映射(端口不能修败)
9.RS可使用大多数OS系统

3.3 TUN模式

转发方式:不修改请求报文的IP首部(源IP为CIP,目标IP为VIP),而在原IP报文之外再封装一个IP首部 (源IP是DIP,目标IP是RIP),将报文发往挑选出的目标RS;RS直接响应给客户端(源IP是VIP,目标IP 是CIP)

TUN模式数据传输过程

1.客户端发送请求数据包,包内有源IP+vip+dport

2.到达vs调度器后对客户端发送过来的数据包重新封装添加IP报文头,新添加的IP报文头中包含 TUNSRCIP(DIP)+TUNDESTIP(RSIP1)并发送到RS1

3.RS收到VS调度器发送过来的数据包做出响应,生成的响应报文中包含SRCIP(VIP)+DSTIP(CIP) +port,响应数据包通过网络直接回传给client

  • ​特点​​:

    • 1.DIP, VIP, RIP都应该是公网地址

    • 2.RS的网关一般不能指向DIP

    • 3.请求报文要经由Director,但响应不能经由Director

    • 4.不支持端口映射 5.RS的OS须支持隧道功能

3.4 FULLNAT模式

fullnat:通过同时修改请求报文的源IP地址和目标IP地址进行转发

CIP --> DIP

VIP --> RIP

1.VIP是公网地址,RIP和DIP是私网地址,且通常不在同一IP网络;因此,RIP的网关一般不会指向DIP

2.RS收到的请求报文源地址是DIP,因此,只需响应给DIP;但Director还要将其发往Client

3.请求和响应报文都经由Director

4.支持端口映射

  • ​特点​​:

    • 同时修改源和目标IP

    • 需要内核补丁支持

LVS工作模式总结

lvs-nat与lvs-fullnat:请求和响应报文都经由Director

lvs-nat:RIP的网关要指向DIP

lvs-fullnat:RIP和DIP未必在同一IP网络,但要能通信 

lvs-dr与lvs-tun:请求报文要经由Director,但响应报文由RS直接发往Client

lvs-dr:通过封装新的MAC首部实现,通过MAC网络转发 lvs-tun:通过在原IP报文外封装新IP头实现转发,支持远距离通信

四、LVS调度算法

ipvs scheduler:根据其调度时是否考虑各RS当前的负载状态被分为两种:静态方法和动态方法

静态方法:仅根据算法本身进行调度,不考虑RS的负载情况

动态方法:主要根据每RS当前的负载状态及调度算法进行调度Overhead=value较小的RS将被调度

1. 静态调度算法

1、RR:roundrobin 轮询 RS分别被调度,当RS配置有差别时不推荐

2、WRR:Weighted RR,加权轮询根据RS的配置进行加权调度,性能差的RS被调度的次数少 3、SH:Source Hashing,实现session sticky,源IP地址hash;将来自于同一个IP地址的请求始终发往 第一次挑中的RS,从而实现会话绑定

4、DH:Destination Hashing;目标地址哈希,第一次轮询调度至RS,后续将发往同一个目标地址的请 求始终转发至第一次挑中的RS,典型使用场景是正向代理缓存场景中的负载均衡,如:宽带运营商

算法

描述

适用场景

RR

轮询调度

RS性能相近

WRR

加权轮询

RS性能差异

SH

源地址哈希

会话保持

DH

目标地址哈希

缓存服务器

2. 动态调度算法

主要根据RS当前的负载状态及调度算法进行调度Overhead=value较小的RS会被调度

1、LC:least connections(最少链接发)

        适用于长连接应用Overhead(负载值)=activeconns(活动链接数) x 256+inactiveconns(非活 动链接数)

2、WLC:Weighted LC(权重最少链接)

        默认调度方法Overhead=(activeconns x 256+inactiveconns)/weight

3、SED:Shortest Expection Delay,

        初始连接高权重优先Overhead=(activeconns+1+inactiveconns) x 256/weight

        但是,当node1的权重为1,node2的权重为10,经过运算前几次的调度都会被node2承接

4、NQ:Never Queue,第一轮均匀分配,后续SED

5、LBLC:Locality-Based LC,动态的DH算法,使用场景:根据负载状态实现正向代理

6、LBLCR:LBLC with Replication,带复制功能的LBLC,解决LBLC负载不均衡问题,从负载重的复制 到负载轻的RS

算法

描述

计算公式

LC

最少连接

activeconns×256 + inactiveconns

WLC

加权最少连接

(activeconns×256 + inactiveconns)/weight

SED

最短预期延迟

(activeconns+1)×256/weight

NQ

永不排队

首轮均匀分配

LBLC

基于局部性的最少连接

动态DH算法

3. 新调度算法(4.15+内核)

  • 1.FO(Weighted Fai Over)调度算法:常用作灰度发布

  • 在此FO算法中,遍历虚拟服务所关联的真实服务器链表,找到还未过载(未设置IP_VS_DEST_F OVERLOAD标志)的且权重最高的真实服务器,进行调度

  • 当服务器承接大量链接,我们可以对此服务器进行过载标记(IP_VS_DEST_F OVERLOAD),那么vs调度 器就不会把链接调度到有过载标记的主机中。

2.OVF(Overflow-connection)调度算法

基于真实服务器的活动连接数量和权重值实现。将新连接调度到权重值最高的真实服务器,直到其活动 连接数量超过权重值,之后调度到下一个权重值最高的真实服务器,在此OVF算法中,遍历虚拟服务相关 联的真实服务器链表,找到权重值最高的可用真实服务器。一个可用的真实服务器需要同时满足以下条 件:

未过载(未设置IP_VS_DEST_F OVERLOAD标志)

真实服务器当前的活动连接数量小于其权重值

其权重值不为零

五、lvs部署命令介绍

1. lvs软件相关信息

程序包:ipvsadm 
Unit File: ipvsadm.service 
主程序:/usr/sbin/ipvsadm 
规则保存工具:/usr/sbin/ipvsadm-save 
规则重载工具:/usr/sbin/ipvsadm-restore 
配置文件:/etc/sysconfig/ipvsadm-config 
ipvs调度规则文件:/etc/sysconfig/ipvsadm

2. ipvsadm命令

核心功能:

集群服务管理:增、删、改

集群服务的RS管理:增、删、改

查看

命令参数

管理集群服务

ipvsadm -A|E -t(tcp)|u(udp)|f(防护墙标签) \

service-address(集群地址) \

[-s scheduler(调度算法)] \

[-p [timeout]] \ [-M netmask] \

[--pepersistence_engine] \

[-b sched-flags] ipvsadm -D -t|u|f service-address                 删除

ipvsadm –C                                                                                 清空

ipvsadm –R                                                                                 重载

ipvsadm -S [-n]                                        保存

管理集群中的real server

ipvsadm -a|e -t|u|f service-address -r server-address [-g | -i| -m](工作模式) [-w weight](权重)

ipvsadm -d -t|u|f service-address -r server-address                         删除RS

ipvsadm -L|l [options]                         查看rs

ipvsadm -Z [-t|u|f service-address] 清楚计数器

六、lvs集群中的增删改

1.管理集群服务中的增删改

ipvsadm -A|E -t|u|f service-address [-s scheduler] [-p [timeout]]

-A #添加

-E #修改

-t #tcp服务

-u #udp服务

-s #指定调度算法,默认为WLC

-p #设置持久连接超时,持久连接可以理解为在同一个时间段同一个来源的请求调度到同一Realserver

-f #firewall mask 火墙标记,是一个数

#增加
[root@DR-server ~]# ipvsadm -A -t 172.25.254.100:80 -s rr
[root@DR-server ~]# ipvsadm -A  -f 66  -p 3000
#修改
[root@DR-server ~]# ipvsadm -E -t 172.25.254.100:80  -s wrr -p 3000
#删除
[root@DR-server ~]# ipvsadm -D -t 172.25.254.100:80
[root@DR-server ~]# ipvsadm -D -f 66

2.管理集群中RealServer的曾增删改

ipvsadm -a|e -t|u|f service-address -r realserver-address [-g|i|m] [-w weight]

-a                #添加realserver

-e                #更改realserver

-t                 #tcp协议

-u                #udp协议

-f                 #火墙 标签

-r·                #realserver地址

-g                #直连路由模式

-i                 #ipip隧道模式

-m               #nat模式   

-w               #设计权重

-Z               #清空计数器

-C               #清空lvs策略

-L                #查看lvs解析

-n                #不做解析

--rate :   输出效率信息

 

#添加[root@DR-server ~]# ipvsadm -a -t 172.25.254.100:80 -r 192.168.0.30 -m[root@DR-server ~]# ipvsadm -a -t 172.25.254.100:80 -r 192.168.0.40 -m -w 2#更改[root@DR-server ~]# ipvsadm -e -t 172.25.254.100:80 -r 192.168.0.30 -m -w 1[root@DR-server ~]# ipvsadm -e -t 172.25.254.100:80 -r 192.168.0.30 -i -w 1#删除 [root@DR-server ~]# ipvsadm -d -t 172.25.254.100:80 -r 192.168.0.30
[root@DR-server ~]# ipvsadm -Ln
[root@D[root@DR-server ~]# ipvsadm -Ln
[root@DR-server ~]# ipvsadm -C

pvs规则:/proc/net/ip_vs

ipvs连接:/proc/net/ip_vs_conn

七、常见问题

  1. ​DR模式ARP问题​​:确保RS正确配置ARP抑制

  2. ​NAT模式性能瓶颈​​:VS可能成为吞吐量瓶颈

  3. ​会话保持​​:使用SH算法或-p参数设置持久连接

  4. ​真实服务器健康检查​​:需额外配置监控脚本

http://www.dtcms.com/a/287459.html

相关文章:

  • 网络通信原理:分层协作与协议解析
  • Matplotlib 30分钟精通
  • 免费收听广播
  • C++类和对象(一)基础内容讲解
  • 使用uvx运行和安装Python应用程序
  • GEO营销:AI时代的搜索优化新赛道——从DeepSeek爆火看生成式引擎优化的崛起
  • 边界条件汇总
  • 初等数论Ⅱ
  • Spring监听器
  • (LeetCode 面试经典 150 题) 49. 字母异位词分组 (哈希表)
  • 开疆智能Profinet转ModbusTCP网关连接康耐视InSight相机案例
  • [故障诊断方向]SNNs:针对小样本轴承故障诊断的孪生神经网络模型
  • ICT测试原理之shorts(短路)测试原理
  • 【2025最新】 .NET FrameWork微软离线运行库合集,一键安装版
  • 【数据类型与变量】
  • python爬虫之获取渲染代码
  • SAP的数据转换和处理
  • RabbitMQ01——基础概念、docker配置rabbitmq、内部执行流程、五种消息类型、测试第一种消息类型
  • 西门子 S7-1500 PLC 电源选型指南:系统电源与负载电源的核心区别
  • SPARKLE:深度剖析强化学习如何提升语言模型推理能力
  • 商业秘密的法律属性与保护路径探析
  • Vue的路由模式的区别和原理
  • RTSP推流客户端-ffmpeg和live555对比
  • Oracle Database 23ai 技术细节与医疗 AI 应用
  • windows docker-01-desktop install windows10 + wls2 启用
  • 加法速算之尾数法
  • 语音识别技术:从声音到文字的 AI 魔法
  • 多云联邦集群管理(1)(集群联邦管理)
  • 基于大模型打造故障预警服务器巡检机器人
  • World of Warcraft [CLASSIC] The Ruby Sanctum [RS] Halion