负载均衡之Haproxy（一）

程序员文章站 2022-03-30 11:53:26

...

一、简介

1、HAProxy概述

HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理，支持虚拟主机，它是免费、快速并且可靠的一种解决方案。根据官方数据，其最高极限支持10G的并发。
HAProxy特别适用于那些负载特大的web站点，这些站点通常又需要会话保持或七层处理。HAProxy运行在当前的硬件上，完全可以支持数以万计的并发连接。并且它的运行模式使得它可以很简单安全的整合进您当前的架构中，同时可以保护你的web服务器不被暴露到网络上。
其支持从4层至7层的网络交换，即覆盖所有的TCP协议。就是说，Haproxy 甚至还支持 Mysql的均衡负载。
而Haproxy 仅仅是一款的用于均衡负载的应用代理。其自身并不能提供web服务。但其配置简单，拥有非常不错的服务器健康检查功能还有专门的系统状态监控页面，当其代理的后端服务器出现故障, HAProxy会自动将该服务器摘除，故障恢复后再自动将该服务器加入。

2、HAProxy 功能

HAProxy 是 TCP / HTTP 反向代理服务器，尤其适合于高可用性高并发环境
1）可以针对 HTTP 请求添加 cookie，进行路由后端服务器
2）可平衡负载至后端服务器，并支持持久连接
3）支持基于 cookie 进行调度
4）支持所有主服务器故障切换至备用服务器
5）支持专用端口实现监控服务
6）支持不影响现有连接情况下停止接受新连接请求
7）可以在双向添加，修改或删除 HTTP 报文首部
8）支持基于 pattern 实现连接请求的访问控制
9）通过特定的 URI 为授权用户提供详细的状态信息

二、规划和架构

1、规划

负载均衡之Haproxy（一）

2、架构图

负载均衡之Haproxy（一）

三、安装

1、安装依赖

yum -y install make gcc gcc-c++ openssl-devel

2、安装Haproxy

1）下载

Github地址：https://github.com/haproxy/haproxy/releases/

cd /root/
wget -c https://github.com/haproxy/haproxy/archive/v2.1.0.tar.gz

2）解压，查看内核版本并安装

tar -xf v2.1.0.tar.gz
cd haproxy-2.1.0/
make TARGET=linux-glibc                #指定内核类型
make install PREFIX=/usr/local/haproxy #指定安装路径
ls /usr/local/haproxy/

3）若没有生成配置文件，则手动编写一个即可

mkdir /usr/local/haproxy/etc
cat /usr/local/haproxy/etc/haproxy.cfg
global
log 127.0.0.1  local0
#log 127.0.0.1  local1 notice
#log loghost    local0 info
maxconn 4096
chroot /usr/local/haproxy
uid 99                     #所属运行的用户uid
gid 99                     #所属运行的用户组
daemon                     #以后台形式运行haproxy
nbproc 1                   #启动1个haproxy实例。工作进程数量(CPU数量) ，实际工作中，应该设置成和CPU核心数一样。 这样可以发挥出最大的性能。
pidfile /usr/local/haproxy/run/haproxy.pid  #将所有进程写入pid文件
#debug      #调试错误时用
#quiet      #安静
defaults
log    global
log    127.0.0.1      local3        #日志文件的输出定向。产生的日志级别为local3. 系统中local1-7，用户自己定义
mode    http           #工作模式，所处理的类别,默认采用http模式，可配置成tcp作4层消息转发
option  httplog                     #日志类别，记载http日志
option  httpclose      #每次请求完毕后主动关闭http通道,haproxy不支持keep-alive,只能模拟这种模式的实现
option  dontlognull    #不记录空连接，产生的日志
option  forwardfor     #如果后端服务器需要获得客户端真实ip需要配置的参数，可以从Http Header中获得客户端ip
option  redispatch     #当serverid对应的服务器挂掉后，强制定向到其他健康服务器
retries 2              #2次连接失败就认为服务器不可用，主要通过后面的check检查
maxconn 2000           #最大连接数
balance roundrobin                    #负载均衡算法
stats  uri    /haproxy-stats          #haproxy 监控页面的访问地址 # 可通过 http://localhost:80/haproxy-stats 访问
timeout connect      5000             #连接超时时间。 单位：ms 毫秒
timeout client       50000            #客户端连接超时时间
timeout server      50000             #服务器端连接超时时间
mode    http
option  httpchk GET /index.html       #健康检测#注意实际工作中测试时，应该下载某一个页面来进行测试，因此这个页面应该是个小页面，而不要用首页面。这里是每隔一秒检查一次页面。
frontend http          #前端配置，http名称可自定义
bind 0.0.0.0:80        #发起http请求80端口，会被转发到设置的ip及端口
default_backend http_back   #转发到后端 写上后端名称
backend http_back    #后端配置，名称上下关联
server  s1 192.168.171.119:80  weight 3 check  #后端的主机 IP &权衡
server  s2 192.168.171.129:80  weight 3 check  #后端的主机 IP &权衡
#server node1 192.168.179.131:8081 check inter 2000 rise 3 fall 3 weight 30
#inter 2000 健康检查时间间隔2秒
#rise 3 检测多少次才认为是正常的
#fall 3 失败多少次才认为是不可用的
#weight 30 权重

负载均衡之Haproxy（一）

4）HAProxy 基础配置文件详解

HAProxy 配置文件根据功能和用途，主要有 5 个部分组成，但有些部分并不是必须的，可以根据需要选择相应的部分进行配置。

1> global部分

用来设定全局配置参数，属于进程级的配置，通常和操作系统配置有关。

log：全局的日志配置，local0 是日志设备，info 表示日志级别。其中日志级别有err、warning、info、debug 四种可选。这个配置表示使用 127.0.0.1 上的 rsyslog 服务中的local0 日志设备，记录日志等级为info。
maxconn：设定每个 haproxy 进程可接受的最大并发连接数，此选项等同于 Linux命令行选项“ulimit -n”。
user/group：设置运行 haproxy 进程的用户和组，也可使用用户和组的uid和gid值来替代。
daemon：设置 HAProxy 进程进入后台运行。这是推荐的运行模式。
nbproc：设置 HAProxy 启动时可创建的进程数，此参数要求将HAProxy 运行模式设置为“daemon”，默认只启动一个进程。根据使用经验，该值的设置应该小于服务器的 CPU核数。创建多个进程，能够减少每个进程的任务队列，但是过多的进程可能会导致进程的崩溃。
pidfile：指定 HAProxy 进程的 pid 文件。启动进程的用户必须有访问此文件的权限。

2> defaults 部分

默认参数的配置部分。在此部分设置的参数值，默认会自动被引用到下面的 frontend、backend和 listen部分中，因此，如果某些参数属于公用的配置，只需在 defaults 部分添加一次即可。而如果在 frontend、backend 和 listen 部分中也配置了与 defaults 部分一样的参数，那么defaults 部分参数对应的值自动被覆盖。

mode：设置 HAProxy实例默认的运行模式，有 tcp、http、health 三个可选值。
tcp模式:在此模式下，客户端和服务器端之间将建立一个全双工的连接，不会对七层报文做任何类型的检查，默认为tcp模式，经常用于SSL、SSH、SMTP 等应用。
http模式:在此模式下，客户端请求在转发至后端服务器之前将会被深度分析，所有不与RFC格式兼容的请求都会被拒绝。
health模式:目前此模式基本已经废弃，不在多说。
retries：设置连接后端服务器的失败重试次数，连接失败的次数如果超过这里设置的值，HAProxy会将对应的后端服务器标记为不可用。此参数也可在后面部分进行设置。
timeout connect：设置成功连接到一台服务器的最长等待时间，默认单位是毫秒，但也可以使用其他的时间单位后缀。
timeout client：设置连接客户端发送数据时最长等待时间，默认单位是毫秒，也可以使用其他的时间单位后缀。
timeout server：设置服务器端回应客户度数据发送的最长等待时间，默认单位是毫秒，也可以使用其他的时间单位后缀。
timeout check：设置对后端服务器的检测超时时间，默认单位是毫秒，也可以使用其他的时间单位后缀。

3> frontend部分

此部分用于设置接收用户请求的前端虚拟节点。frontend是在 HAProxy1.3版本之后才引入的一个组件，同时引入的还有 backend组件。通过引入这些组件，在很大程度上简化了 HAProxy配置文件的复杂性.frontend可以根据 ACL规则直接指定要使用的后端。

bind：此选项只能在 frontend 和 listen 部分进行定义，用于定义一个或几个监听的套接字。bind 的使用格式为:bind [

:<port_range>] interface 其中，address 为可选选项，其可以为主机名或IP地址，如果将其设置为“*”或“0.0.0.0”，将监听当前系统的所有 IPv4地址。port_range可以是一个特定的 TCP端口，也可是一个端口范围，小于 1024 的端口需要有特定权限的用户才能使用。interface 为可选选项，用来指定网络接口的名称，只能在 Linux 系统上使用。
option httplog：在默认情况下，haproxy 日志是不记录 HTTP 请求的，这样很不方便 HAProxy 问题的排查与监控。通过此选项可以启用日志记录 HTTP请求。
option forwardfor：如果后端服务器需要获得客户端的真实IP，就需要配置此参数。由于HAProxy工作于反向代理模式，因此发往后端真实服务器的请求中的客户端 IP均为 HAProxy主机的 IP，而非真正访问客户端的地址，这就导致真实服务器端无法记录客户端真正请求来源的 IP，而“X-Forwarded-For”则可用于解决此问题。通过使用“forwardfor”选项，HAProxy 就可以向每个发往后端真实服务器的请求添加“X-Forwarded-For”记录，这样后端真实服务器日志可以通过“X-Forwarded-For”信息来记录客户端来源 IP。
option httpclose：此选项表示在客户端和服务器端完成一次连接请求后，HAProxy 将主动关闭此 TCP 连接。这是对性能非常有帮助的一个参数。
log global：表示使用全局的日志配置，这里的“ global”表示引用在HAProxy 配置文件 global 部分中定义的 log 选项配置格式。
default_backend：#指定默认的后端服务器池，也就是指定一组后端真实服务器，而这些真实服务器组将在 backend 段进行定义。这里的htmpool 就是一个后端服务器组。

4> backend部分

此部分用于设置集群后端服务集群的配置，也就是用来添加一组真实服务器，以处理前端用户的请求。添加的真实服务器类似于 LVS中的real server节点。

option redispatch：此参数用于cookie保持的环境中。在默认情况下，HAProxy会将其请求的后端服务器的 serverID 插入到 cookie 中，以保证会话的 SESSION 持久性。而如果后端的服务器出现故障，客户端的 cookie 是不会刷新的，这就出现了问题。此时，如果设置此参数，就会将客户的请求强制定向到另外一个健康的后端服务器上，以保证服务的正常。
option abortonclose：如果设置了此参数，可以在服务器负载很高的情况下，自动结束掉当前队列中处理时间比较长的链接。
balance：此关键字用来定义负载均衡算法。目前 HAProxy 支持多种负载均衡算法，常用的有如下几种：
roundrobin 是基于权重进行轮询调度的算法，在服务器的性能分布比较均匀的时候，这是一种最公平、最合理的算法。此算法经常使用。
static-rr 也是基于权重进行轮询的调度算法，不过此算法为静态方法，在运行时调整其服务器权重不会生效。
source 是基于请求源 IP 的算法。此算法先对请求的源 IP 进行 hash 运算，然后将结果与后端服务器的权重总数相除后转发至某个匹配的后端服务器。这种方式可以使同一个客户端 IP 的请求始终被转发到某特定的后端服务器。
leastconn 此算法会将新的连接请求转发到具有最少连接数目的后端服务器。在会话时间较长的场景中推荐使用此算法，例如数据库负载均衡等。此算法不适合会话较短的环境中，例如基于 HTTP的应用。
uri 此算法会对部分或整个 URI进行hash运算，再经过与服务器的总权重相除，最后转发到某台匹配的后端服务器上。
uri_param 此算法会根据 URL 路径中的参数进行转发，这样可保证在后端真实服务器数量不变时，同一个用户的请求始终分发到同一台机器上。
hdr():此算法根据 http 头进行转发，如果指定的 http 头名称不存在，则使用 roundrobin 算法进行策略转发。
cookie：表示允许向 cookie 插入 SERVERID，每台服务器的 SERVERID 可在下面的 server 关键字中使用 cookie 关键字定义。
option httpchk：此选项表示启用 HTTP 的服务状态检测功能。HAProxy 作为一款专业的负载均衡器，它支持对 backend 部分指定的后端服务节点的健康检查，以保证在后端 backend 中某个节点不能服务时，把从 frotend 端进来的客户端请求分配至 backend 中其他健康节点上，从而保证整体服务的可用性。“option httpchk”的用法如下：
option httpchk 其中，各个参数的含义如下：
method 表示 HTTP 请求的方式，常用的有 OPTIONS、GET、HEAD 几种方式。一般的健康检查可以采用 HEAD 方式进行，而不是才采用 GET 方式，这是因为 HEAD 方式没有数据返回，仅检查 Response 的 HEAD 是不是 200 状态。因此相对与 GET 来说，HEAD 方式更快，更简单。
uri 表示要检测的 URL 地址，通过执行此 URL，可以获取后端服务器的运行状态。在正常情况下将返回状态码 200，返回其他状态码均为异常状态。
version指定心跳检测时的 HTTP的版本号。
server：这个关键字用来定义多个后端真实服务器，不能用于 defaults 和frontend部分。使用格式为：server <name> <address>[:port] [param*]其中，每个参数含义如下：
check：表示启用对此后端服务器执行健康状态检查。
inter：设置健康状态检查的时间间隔，单位为毫秒。
rise：设置从故障状态转换至正常状态需要成功检查的次数，例如。“rise 2”表示 2 次检查正确就认为此服务器可用。
fall：设置后端服务器从正常状态转换为不可用状态需要检查的次数，例如，“fall 3”表示 3 次检查失败就认为此服务器不可用。
cookie：为指定的后端服务器设定 cookie 值，此处指定的值将在请求入站时被检查，第一次为此值挑选的后端服务器将在后
<name> 为后端真实服务器指定一个内部名称，随便定义一个即可。
<address> 后端真实服务器的 IP 地址或主机名。
<port> 指定连接请求发往真实服务器时的目标端口。在未设定时，将使用客户端请求时的同一端口。
[param*] 为后端服务器设定的一系参数，可用参数非常多，这里仅介绍常用的一些参数：
check：表示启用对此后端服务器执行健康状态检查。
inter：设置健康状态检查的时间间隔，单位为毫秒。
rise：设置从故障状态转换至正常状态需要成功检查的次数，例如。“rise 2”表示 2次检查正确就认为此服务器可用。
fall：设置后端服务器从正常状态转换为不可用状态需要检查的次数，例如，“fall 3”表示3次检查失败就认为此服务器不可用。
cookie：为指定的后端服务器设定 cookie值，此处指定的值将在请求入站时被检查，第一次为此值挑选的后端服务器将在后续的请求中一直被选中，其目的在于实现持久连接的功能。上面的“cookie server1”表示 web1 的 serverid 为 server1。同理， “cookie server2”表示 web2 的 serverid 为 server2。
weight：设置后端真实服务器的权重，默认为1，最大值为256。设置为0表示不参与负载均衡。
backup：设置后端真实服务器的备份服务器，仅仅在后端所有真实服务器均不可用的情况下才启用。

5> listen部分

此部分是 frontend 部分和 backend 部分的结合体。在 HAProxy1.3 版本之前，HAProxy 的所有配置选项都在这个部分中设置。为了保持兼容性，HAProxy 新的版本仍然保留了 listen 组件的配置方式。目前在 HAProxy 中，两种配置方式任选其一即可。
这个部分通过listen 关键字定义了一个名为“admin_stats”的实例，其实就是定义了一个 HAProxy 的监控页面，每个选项的含义如下：

stats refresh：设置 HAProxy 监控统计页面自动刷新的时间。
stats uri：设置 HAProxy 监控统计页面的URL 路径，可随意指定。例如、指定“stats uri /haproxy-status”，就可以过 http://IP:9188/haproxy-status 查看。
stats realm：设置登录 HAProxy 统计页面时密码框上的文本提示信息。
stats auth：设置登录 HAProxy 统计页面的用户名和密码。用户名和密码通过冒号分割。可为监控页面设置多个用户名和密码，每行一个。
stats hide-version：用来隐藏统计页面上 HAProxy 的版本信息。
stats admin if TRUE：通过设置此选项，可以在监控页面上手工启用或禁用后端真实服务器，仅在 haproxy1.4.9 以后版本有效。

5）配置日志收集

vim /etc/rsyslog.conf         #打开以下两行的注释，不打开收不到日志
$ModLoad imudp                #取消注释
$UDPServerRun 514             #取消注释
local7.*   /var/log/boot.log  #下面添加一行
local3.*  /var/log/haproxy.log

负载均衡之Haproxy（一）

systemctl restart rsyslog     #重启系统日志服务

6）启动haproxy

/usr/local/haproxy/sbin/haproxy -f /usr/local/haproxy/etc/haproxy.cfg

负载均衡之Haproxy（一）

7）验证

1> 事先在web01和web02上安装好httpd服务，并编写好index文件
负载均衡之Haproxy（一）

2>客户端验证
192.168.171.130服务器上

3>浏览器端

http://192.168.171.139/haproxy-stats

负载均衡之Haproxy（一）

负载均衡之Haproxy（一）

一、简介

1、HAProxy概述

2、HAProxy 功能

二、规划和架构

1、规划

2、架构图

三、安装

1、安装依赖

2、安装Haproxy

1）下载

2）解压，查看内核版本并安装

3）若没有生成配置文件，则手动编写一个即可

4）HAProxy 基础配置文件详解

1> global部分

2> defaults 部分

3> frontend部分

4> backend部分

5> listen部分

5）配置日志收集

6）启动haproxy

7）验证

linux服务器之LVS、Nginx和HAProxy负载均衡器对比总结

haproxy+keepalived实现高可用负载均衡(理论篇)

详解利用nginx和docker实现一个简易的负载均衡

高可用负载均衡服务器实现（keepalived+haproxy）

[Oracle] RAC 之 - 负载均衡深入解析

Eureka源码探索（一）-客户端服务端的启动和负载均衡

CDN的核心技术之一：负载均衡

为何一个@LoadBalanced注解就能让RestTemplate拥有负载均衡的能力？【享学Spring Cloud】

撸一撸Spring Cloud Ribbon的原理-负载均衡策略

负载均衡服务之HAProxy基础配置（二）