LVS四种工作模式和十种算法-526互联

LVS是什么？

LVS是基于4层的负载均衡技术，它是Linux内核的一个模块。

LVS的四种模式：

1）NAT模式客户端访问LVS时，LVS通过重写请求报文的目标地址，且根据预设的调度算法，将请求分派给后端真实服务器，真实服务器接收到请求处理后，发出响应报文也需要通过LVS返回，返回时需要修改报文的源地址，然后返回给客户，完成整个负载调度过程。

NAT 模式就是使用 DNAT（目标地址转换，改变的是目标地址）和 SNAT（源地址转换，改变的是源地址）技术完成报的转发，NAT 方式可支持任何的操作系统，以及私有网络，并且只需一个 Internet IP 地址，非常节省成本，但是整个系统的性能受到限制。因为执行 NAT 每次需要重写数据包，有一定的延迟，另外，大部分应用有 80%的数据是从服务器流向客户机，也就是用户的请求非常短，而服务器的回应非常大，对LVS形成很大压力，容易成为瓶颈。

2）IP TUN模式IP TUN（IP Tunneling 即 IP隧道）当 LVS 分配请求到不同的 real server，real server 处理请求后直接回应给用户，这样 LVS 仅处理客户机与服务器的一半连接。IP TUN 技术极大地提高了 LVS 的调度处理能力，同时也极大地提高了系统能容纳的最大节点数，可以超过 100 个节点。real server 可以在任何 LAN 或 WAN 上运行，这意味着允许地理上的分布，这在灾难恢复中有重要意义。但此模式要求所有服务器必须支持 IP 隧道协议，因此只能在 linux 下使用，在 windows 无法使用此模式下，关键步骤：LB会重新封装从客户端发来的包，封装后的包目标IP为其中一个Real Server。

3）DR模式

DR（即 Direct Routing 直接路由）与 IP TUN 类似，负载均衡器仅处理一半的连接，避免了新的性能瓶颈，同样增加了系统的可伸缩性，DR 与 IP TUN 相比，没有 IP 封装的开销，但由于采用物理层（修改 MAC地址）技术，所有服务器都必须在同一个局域网

DR 与 IP TUN 相比，没有 IP 封装的开销，但由于采用数据链路层（修改 MAC地址）技术，所有服务器都必须在一个物理网段。

此模式下，关键步骤：LB会修改从客户端发过来的包里的MAC地址，将MAC地址修改为其中某一个Real Server的mac地址。

4）FULL NAT模式这种模式为NAT模式的升级版。传统的NAT模式，LB和RS必须在同一个VLAN下，否则LB无法作为RS的网关。这引发的两个问题是：

同一个 VLAN的限制导致运维不方便，跨VLAN的RS无法接入。
当RS横向扩容时，总有一天其上的单点LB会成为瓶颈。

Full-NAT解决的是LB和RS跨VLAN的问题，而跨VLAN问题解决后，LB和RS不再存在VLAN上的从属关系，可以做到多个LB对应多个RS，解决水平扩容的问题。Full-NAT相比NAT的主要改进是，在SNAT/DNAT的基础上，加上另一种转换，转换过程如下：

在包从LB转到 RS 的过程中，源地址从客户端IP被替换成了LVS 的内网IP。内网IP之间可以通过多个交换机跨VLAN通信。
当RS处理完接收到的包，返回时，会将这个包返回给LB的内网IP，这一步也不受限于 VLAN。
LB收到包后，在NAT模式修改源地址的基础上，再把RS发来的包中的目标地址从LB内网IP改为客户端的 IP。
Full-NAT主要的思想是把网关和其下机器的通信，改为了普通的网络通信，从而解决了跨VLAN 的问题。采用这种方式，LB和RS的部署在VLAN上将不再有任何限制，大大提高了运维部署的便利性。

LVS的十种调度算法：

LVS的调度算法分为静态与动态两类。

1）静态算法（4种）：只根据算法进行调度而不考虑后端服务器的实际连接情况和负载情况

① RR：轮询调度（Round Robin）调度器通过”轮询”调度算法将外部请求按顺序轮流分配到集群中的真实服务器上，它均等地对待每一台服务器，而不管服务器上实际的连接数和系统负载｡

② WRR：加权轮询（Weight RR）调度器通过“加权轮叫”调度算法根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。

③ DH：目标地址hash（Destination Hash ）根据请求的目标IP地址，作为散列键(HashKey)从静态分配的散列表找出对应的服务器，若该服务器是可用的且未超载，将请求发送到该服务器，否则返回空。

④ SH：源地址 hash（Source Hash）根据请求的源IP地址，作为散列键(HashKey)从静态分配的散列表找出对应的服务器，若该服务器是可用的且未超载，将请求发送到该服务器，否则返回空｡

2）动态算法（6种）：前端的调度器会根据后端真实服务器的实际连接情况来分配请求

① LC：最少链接（Least Connections）动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能，采用”最小连接”调度算法可以较好地均衡负载。

② WLC：加权最少连接(默认采用的就是这种)（Weighted Least Connections）在集群系统中的服务器性能差异较大的情况下，调度器采用“加权最少链接”调度算法优化负载均衡性能，具有较高权值的服务器将承受较大比例的活动连接负载｡调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。

③ SED：最短延迟调度（Shortest Expected Delay ）在WLC基础上改进，Overhead = （ACTIVE+1）*256/加权，不再考虑非活动状态，把当前处于活动状态的数目+1来实现，数目最小的，接受下次请求，+1的目的是为了考虑加权的时候，非活动连接过多缺陷：当权限过大的时候，会导致空闲服务器一直处于无连接状态。

④ NQ永不排队/最少队列调度（Never Queue Scheduling NQ）无需队列。如果有台 realserver的连接数＝0就直接分配过去，不需要再进行sed运算，保证不会有一个主机很空闲。在SED基础上无论+几，第二次一定给下一个，保证不会有一个主机不会很空闲着，不考虑非活动连接，才用NQ，SED要考虑活动状态连接，对于DNS的UDP不需要考虑非活动连接，而httpd的处于保持状态的服务就需要考虑非活动连接给服务器的压力。

⑤ LBLC：基于局部性的最少链接（locality-Based Least Connections）基于局部性的最少链接”调度算法是针对目标IP地址的负载均衡，目前主要用于Cache集群系统｡该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器，若该服务器是可用的且没有超载，将请求发送到该服务器;若服务器不存在，或者该服务器超载且有服务器处于一半的工作负载，则用“最少链接”的原则选出一个可用的服务器，将请求发送到该服务器｡

⑥ LBLCR：带复制的基于局部性最少连接（Locality-Based Least Connections with Replication）

带复制的基于局部性最少链接”调度算法也是针对目标IP地址的负载均衡，目前主要用于Cache集群系统｡它与LBLC算法的不同之处是它要维护从一个目标IP地址到一组服务器的映射，而LBLC算法维护从一个目标IP地址到一台服务器的映射｡该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组，按”最小连接”原则从服务器组中选出一台服务器，若服务器没有超载，将请求发送到该服务器；若服务器超载，则按“最小连接”原则从这个集群中选出一台服务器，将该服务器加入到服务器组中，将请求发送到该服务器｡同时，当该服务器组有一段时间没有被修改，将最忙的服务器从服务器组中删除，以降低复制的程度。