自古帝王多短命,假如皇帝也懂负载均衡算法...
大家都知道古代皇帝各个都是后宫佳丽三千,而皇帝身上都天然的带着雨露均沾的精神,不想单独的宠爱一人!
弱水三千,又怎舍得只取一瓢饮?据传皇帝们晚上睡觉个个都怕冷,因此每晚都需要有人侍寝,那么这么多后宫,该翻谁牌子、怎么分配侍寝名额呢?
还别说,皇帝行房事竟还挺讲究的!早在《春秋》就有记载“晦阴惑疾,明谣心疾,以辟六气”。
九嫔以下,每九人中进御一人,八十一女御占九个晚上,世妇二十七人占三个晚上,九嫔占一个晚上,三夫人占一个晚上,以上共十四夜,皇后独占一个晚上,共十五夜。上半个月按上述安排进御,下半个月从十六日开始,由皇后起,再御九嫔、世妇、女御,与月亮由盛而衰相对应......
不同朝代的皇帝也有不同宠幸妃子的方法,著名的有羊车望幸、掷筛侍寝、蝶幸、翻牌悬灯等等。
不过在我看来,如果皇帝懂负载均衡算法的话,大可不必这么折腾,一套算法便可搞定终身侍寝大事!因此我们今天来介绍几种常用的负载均衡算法及代码实现!
先看下文章的大纲:
-
轮询算法
-
加权轮询算法
-
随机算法
-
加权随机算法
-
源地址 hash 算法
-
一致性 hash 算法
轮询算法
据史料记载,乾隆一生妃嫔就有 42 人,还不算大明湖畔的夏雨荷等在下江南时候留下的情。
假设在某个时期内,皇阿玛最宠幸的有令妃、娴妃、高贵妃、纯妃四位。那普通的轮询算法怎么去选择呢?
我们先定义一个妃子集合如下:
/**
* *所有妃子集合
*/
public static final List PRINCESS_LIST = Arrays.asList("令妃", "娴妃", "高贵妃", "纯妃");
然后从列表中轮询侍寝的妃子,用一个变量 index 去记录轮询的位置。
// 记录循环的位置
private static Integer index = 0;
public static void main(String[] args) {
for (int i = 0; i < 10; i++) {
System.out.println(getPrincess());
}
}
private static String getPrincess() {
// 超过数组大小需要归零(每次获取前判断,防止配置变化导致索引越界)
if (index >= PrincessConfig.PRINCESS_LIST.size()) {
index = 0;
}
String princess = PrincessConfig.PRINCESS_LIST.get(index);
index++;
return princess;
}
输出结果就不贴出来了。该算法的特点就是简单、简单、简单!但是也存在很大缺点!
如果皇帝更宠爱令妃,想让她侍寝的概率更高呢?那就需要用到下面的加权轮询算法!
加权轮询算法
加权轮询就是可以主观的给每个妃子设置一个喜好值(权重值),以控制被选中的概率,因此我们需要定义如下的配置:
/**
* *所有妃子集合
*/
public static final Map<String, Integer> PRINCESS_MAP = new LinkedHashMap<String, Integer>() {
{
put("令妃", 5);
put("娴妃", 1);
put("高贵妃", 3);
put("纯妃", 2);
}
};
这里的配置就不再是简单的一个集合,每个妃子都对应了一个权重值,那轮询的时候怎么根据这个值去提高被选中的概率呢?
下面我们来讲三种比较常见的实现。
加权轮询实现一
我们的思路是把这个 map 的 key(妃子)根据权重值转存到一个 list 中,然后再去轮询这个 list,如果权重值为 5,那就在 list 中添加 5 条相同的记录!
然后我们去遍历这个 list,这样权重值越高,在 list 中出现的概率就越高,被轮询中的概率也就越高!
// 记录循环的位置
private static Integer index = 0;
public static void main(String[] args) {
for (int i = 0; i < 11; i++) {
System.out.println(getPrincess1());
}
}
private static String getPrincess1() {
// 遍历map放入到list中
List princessList = new ArrayList();
for (String princess : PrincessConfig.PRINCESS_MAP.keySet()) {
int weight = PrincessConfig.PRINCESS_MAP.get(princess);
// 根据权重值重复放入到一个list中
for (int i = 0; i < weight; i++) {
princessList.add(princess);
}
}
if (index >= princessList.size()) {
index = 0;
}
String princess = princessList.get(index);
index++;
return princess;
}
输出结果如下:
该加权轮询算法比较简单,比较容易实现。但是也有个问题,我们配置的权重值是 5、1、3、2,那我们是不是也可以配置成 50、10、30、20 呢?
那按照上面的方式,我们是不是就需要把同样的元素往 list 里面放几百个呢?这显然是比较不合理且耗内存的!
加权轮询实现二
基于上面的算法存在的问题,我们考虑用类似占比的方式来处理。
比如我们配置的权重值为 50、10、30、20,那在横坐标上表示就是 0_____50_60__80__110。
我们还是用一个 index 去记录轮询的位置,如果 index 在 0~50 之间就代表第一个妃子被选中,如果在 50~60 之间就代表第二个妃子被选中......
我们看具体代码实现:
// 记录循环的位置
private static Integer indexInteger = 0;
public static void main(String[] args) {
for (int i = 0; i < 11; i++) {
System.out.println(getPrincess2());
}
}
private static String getPrincess2() {
//记录总权重值
int totalWeight = 0;
for (String princess : PrincessConfig.PRINCESS_MAP.keySet()) {
int weight = PrincessConfig.PRINCESS_MAP.get(princess);
totalWeight += weight;
}
// 归零
if (indexInteger >= totalWeight) {
indexInteger = 0;
}
int index = indexInteger;
String result = null;
for (String princess : PrincessConfig.PRINCESS_MAP.keySet()) {
int weight = PrincessConfig.PRINCESS_MAP.get(princess);
// 落在当前区间 直接返回
if (index < weight) {
result = princess;
break;
}
// 没有落在当前区间 继续循环
index = index - weight;
}
indexInteger++;
return result;
}
输出结果与上面的方法一毛一样:
该加权轮询算法略复杂于第一种,但是这两种实现都存在的共同问题是,按照我们目前的配置去轮询会连续 5 次令妃、再 1 次娴妃、再 3 次高贵妃......
连续 5 次!就算皇阿玛再喜欢令妃,怕是令妃也有点吃不消!用计算机术语说也就是负载不是很均衡!
加权轮询实现三(平滑加权轮询)
平滑加权轮询算法就是为了解决上面负载不均衡的情况的,该算法实现起来相对比较复杂!
每个妃子不仅有一个权重值(weight),还有一个会变化的动态权重值(dynamicWeight)来辅助计算。
动态权重值计算逻辑如下:
-
动态权重值 dynamicWeight 初始为 0。
-
每次获取轮询获取目标妃子时先设置 dynamicWeight=dynamicWeight+weight。
-
然后找到所有妃子中动态权重值 dynamicWeight 最大的一个,则为本次轮询到的目标。
-
将本次轮询到的目标的 dynamicWeight 设置为 dynamicWeight-totalWeight(总权重值)。
这样看可能会有点不是很明白,我们来做个推算,假设我们还是有如下配置(配置中只有妃子名称及对应的权重值):
/**
* *所有妃子集合
*/
public static final Map<String, Integer> PRINCESS_MAP = new LinkedHashMap<String, Integer>() {
{
put("令妃", 5);
put("娴妃", 1);
put("高贵妃", 3);
put("纯妃", 2);
}
};
在上面的配置中总权重值 totalWeight=5+1+3+2 等于 11。
①按照上面算法的第一点,在第一次轮询目标之前她们的 dynamicWeight 都是0。
因此四位妃子的 weight 和 dynamicWeight 值如下:
②按照上面算法的第二点,在第一次轮询选中目标的时候 dynamicWeight=dynamicWeight+weight。
变化后四位妃子的 weight 和 dynamicWeight 值如下:
③按照上面算法的第三点,然后找最大的 dynamicWeight,也就是 5,因此第一次轮询选中的就是令妃。
④按照上面算法的第四点,令妃的 dynamicWeight 需要减去 totalWeight。
变化后四位妃子的 weight 和 dynamicWeight 值如下:
然后第二次轮询的时候又需要按照算法的第一点设置 dynamicWeight。
设置后四位妃子的 weight 和 dynamicWeight 值如下:
就这样一直按照算法处理下去,轮询完 11 次后,所有妃子的 dynamicWeight 又会全部变为 0......
如果大家依然还是有点模糊,我们只能上代码为敬了!我们需要先定义一个实体,来存放每个妃子及对应的 weight 及 dynamicWeight 属性:
/**
* *权重实体
*
* @author sullivan
*
*/
public class PrincessWeight {
private String princess;
private Integer weight;
private Integer dynamicWeight;
public PrincessWeight(String princess, Integer weight, Integer dynamicWeight) {
super();
this.princess = princess;
this.weight = weight;
this.dynamicWeight = dynamicWeight;
}
}
然后定义两个全局的对象存放对象:
// 每个妃子及对应的权重实体
private static Map<String, PrincessWeight> weightMap = new HashMap<String, PrincessWeight>();
// 总权重值
private static int totalWeight = 0;
再进行算法的实现:
private static String getPrincess() {
// 初始化妃子及对应的权重实体
if (weightMap.isEmpty()) {
//将配置初始化到map中去
for (String princess : PrincessConfig.PRINCESS_MAP.keySet()) {
// 算法的第一点:初始dynamicWeight为0
weightMap.put(princess, new PrincessWeight(princess, PrincessConfig.PRINCESS_MAP.get(princess), 0));
totalWeight += PrincessConfig.PRINCESS_MAP.get(princess);
}
}
// 算法的第二点:设置currentWeight=设置weight+currentWeight
for (PrincessWeight weight : weightMap.values()) {
weight.setDynamicWeight(weight.getWeight() + weight.getDynamicWeight());
}
// 算法的第三点:寻找最大的currentWeight
PrincessWeight maxPrincessWeight = null;
for (PrincessWeight weight : weightMap.values()) {
if (maxPrincessWeight == null || weight.getDynamicWeight() > maxPrincessWeight.getDynamicWeight()) {
maxPrincessWeight = weight;
}
}
// 算法的第四点:最大的dynamicWeight = dynamicWeight-totalWeight
maxPrincessWeight.setDynamicWeight(maxPrincessWeight.getDynamicWeight() - totalWeight);
return maxPrincessWeight.getPrincess();
}
最终输出如下:
这样经过 11 次轮询,令妃同样出现了 5 次,但是明显不会再像之前算法那样连续出现了,会均衡得多!!!如果还有不清楚的,可以去文末的 Github 地址上下载代码自己调试及理解!
随机算法
平滑加权轮询算法能很好的进行负载了!但是皇阿玛又说了,按照轮询算法,我自己都能够推出来每晚侍寝的妃子,不刺激不刺激。
皇帝嘛,总喜欢来些新鲜的刺激的我们也可以理解!还好我们有随机算法可以解决,每晚都是随机选一个,让皇帝无法提前推测,给皇帝足够的刺激感!
我们依然先定义一个妃子集合如下:
/**
* *所有妃子集合
*/
public static final List PRINCESS_LIST = Arrays.asList("令妃", "娴妃", "高贵妃", "纯妃");
然后利用随机函数去选择一个目标:
public static void main(String[] args) {
for (int i = 0; i < 10; i++) {
System.out.println(getPrincess());
}
}
/**
* *随机获取侍寝妃子
* @return
*/
private static String getPrincess() {
SecureRandom rd = new SecureRandom();
int index = rd.nextInt(PrincessConfig.PRINCESS_LIST.size());
return PrincessConfig.PRINCESS_LIST.get(index);
}
因为输出是随机的,所以这里就不贴出来了。如果明白了轮询算法,随机算法理解起来也就简单了,只是在轮询中用一个全局的 index 去保存每次循环的位置,而在随机中是每次去随机出来一个值。
加权随机算法
加权随机实现一
加权随机实现一与上面的加权轮询实现一的思路几乎一毛一样,这里就直接上代码了:
public static void main(String[] args) {
for (int i = 0; i < 10; i++) {
System.out.println(getPrincess());
}
}
private static String getPrincess() {
List princessList = new ArrayList();
for (String princess : PrincessConfig.PRINCESS_MAP.keySet()) {
int weight = PrincessConfig.PRINCESS_MAP.get(princess);
for (int i = 0; i < weight; i++) {
princessList.add(princess);
}
}
Random rd = new Random();
int index = rd.nextInt(princessList.size());
return princessList.get(index);
}
加权随机实现二
加权随机实现二与上面的加权轮询实现二的思路几乎一模一样,这里也就直接上代码了:
public static void main(String[] args) {
for (int i = 0; i < 10; i++) {
System.out.println(getPrincess2());
}
}
private static String getPrincess2() {
List<String> princessList = new ArrayList<String>();
int totalWeight = 0;
for (String princess : PrincessConfig.PRINCESS_MAP.keySet()) {
int weight = PrincessConfig.PRINCESS_MAP.get(princess);
totalWeight += weight;
for (int i = 0; i < weight; i++) {
princessList.add(princess);
}
}
Random rd = new Random();
int index = rd.nextInt(totalWeight);
String result = null;
for (String princess : PrincessConfig.PRINCESS_MAP.keySet()) {
int weight = PrincessConfig.PRINCESS_MAP.get(princess);
// 落在当前区间 直接返回
if (index < weight) {
result = princess;
break;
}
// 没有落在当前区间 继续循环
index = index - weight;
}
return result;
}
源地址 hash 算法
我们的工作中开发系统很常见的一个需求就是需要登录后才能访问,这就会涉及到 session!
如果我们没有做 session 共享,那登录后的 session 信息只会存在我们调用登录接口的那台服务器上!
按照前面的轮询算法或者随机算法,我们同一客户端的多次请求就会落在不同的服务器上,这样就会导致部分接口没权限访问!
因此我们需要同一个客户端多次的请求落在同一台服务器上,这里常见的一种做法是对源地址进行 hash!
到这里我们也得让我们的皇阿玛歇会儿了,回到我们正常的业务场景中。假如我们有服务器配置如下:
/**
* *所有服务器集合
*/
public static final List SERVER_IP_LIST = Arrays.asList(
"192.168.1.10",
"192.168.2.20",
"192.168.3.30",
"192.168.4.40");
客户端访问的 ip 我也模拟了一个集合:
/**
* *客户端ip
*/
public static final List CLIENT_IP_LIST = Arrays.asList(
"113.88.97.173",
"106.11.154.33",
"207.46.13.149",
"42.156.137.120",
"203.208.60.0",
"119.39.47.182",
"171.34.179.4",
"111.175.58.52",
"124.235.138.199",
"175.184.166.184");
源地址 hash 算法的思路就是对客户端的 ip 进行 hash,然后用 hash 值与服务器的数量进行取模,得到需要访问的服务器的 ip。只要客户端 ip 不变,那 hash 后的值就是固定的!
实现如下:
public static void main(String[] args) {
for (String clientIp : CLIENT_IP_LIST) {
int index = Math.abs(getHash(clientIp)) % PrincessConfig.SERVER_IP_LIST.size();
String serverIp = PrincessConfig.SERVER_IP_LIST.get(index);
System.out.println(clientIp + "请求的服务器ip为" + serverIp);
}
}
最终输出如下:
这样不管执行多少次,相同的客户端 ip 请求得到的服务器地址都是一样的!
这种实现很简单,但也很脆弱!因为我们服务器的数量是可能变化的,今天下线一台机器明天增加一台机器是很常见的!
服务器数量一旦变化,那源地址 hash 之后取模的值可能就变化了,获取到的服务器的 ip 自然就也会发生变化!
比如我们服务器去掉一台 192.168.4.10 的机器再看下输出结果:
对比输出结果我们就能看到,影响几乎是全局的!那我们能不能有一种方案就算是服务器数量变化,也能减少受影响的客户端呢?这就需要用到下面的一致性 hash 算法!
一致性 hash 算法
加权轮询算法实现二中我们讲到过把权重值转化为横坐标展示,我们这里是不是也可以用同样的思路呢?
客户端 ip 进行 hash 后不就是一个 int32 的数字嘛,那我们就可以把一个 int32 的数字分为几个段,让每个服务器负责一个段的请求!
下面为了直观我们把服务器 192.168.2.10、192.168.2.20、192.168.2.30、192.168.2.40 分别用 IP1、IP2、IP3、IP4 表示,如上图:
-
如果客户端 ip 进行 hash 后的值在 0~536870911 之间,那就交给 IP2 服务器处理。
-
如果客户端 ip 进行 hash 后的值在 536870911~1073741822 之间,那就交给 IP3 服务器处理。
-
如果客户端 ip 进行 hash 后的值在 1073741822~1610612733 之间,那就交给 IP4 服务器处理。
-
如果客户端 ip 进行 hash 后的值大于 1610612733 之间,那就交给 IP1 服务器处理。
但是专业一点的表示都会把这个横坐标掰弯,形成一个环,就叫所谓的 hash 环,如下图:
这样看就更直观了!如果有天 IP4 这台服务器宕机,那原来需要到 IP4 的请求就会全部转移到 IP1 服务器进行处理。
这样对部分客户端的请求依然会有影响,但至少影响也只是局部的,如下图:
这样就可以了吗?我们思考两个问题:
-
每个服务器在 hash 环上的位置是我们人为的均匀的分配的,这样经常需要扩容缩容的时候会不会比较难以维护呢?
-
IP4 宕机,原本会到 IP4 的请求全部转移到 IP1,那会不会导致 IP1 的流量不均衡?能不能有一个更均衡一点的方案让原本到 IP4 的流量均衡的转移到 IP1、IP2、IP3 呢?
解决问题 1 的方案就是不再人为分配结点所在的位置,而是根据服务器的 ip 计算出 hash 值,再看 hash 值落在环上的哪个位置!
这样存在的一个问题是每个集群的服务器 ip 都会不同,因此计算后落在环上的位置可能就是不可控的。
如上面四台服务器计算后所在的位置可能会如下图所示:
很明显,这种情况是极为不均匀的,会造成数据的倾斜!上面问题 2 的问题其实也是宕机导致的数据倾斜!
环的左上部分那么空,我们是不是可以把现在的 4 台服务器再根据其他的规则在左上方生成一些结点呢?这样是不是请求就会稍微均匀一点呢?
这就是所谓的虚拟结点!虚拟结点就是同一个服务器 ip 会根据某个规则生成多个 hashcode,这样在环上就存在多个结点了。
如下图所示:
这里只是模拟了每台服务器有两个虚拟结点,实际在开发中会更多!这样就算 IP4 机器挂掉,请求也不会全部压到某一台服务器上去!
讲了这么多,但实现起来也不难,下面就该上代码了(服务器配置及请求的客户端 ip 与源地址 hash 算法部分的一致,这里就不贴对应的代码了,直接上算法逻辑):
//虚拟结点数量100
private static final Integer VIRTUAL_NODES = 100;
public static void main(String[] args) {
// 遍历服务器ip,生成对应的虚拟结点
TreeMap<integer, String> nodeMap = new TreeMap<integer, String>();
for (String serverIp : PrincessConfig.SERVER_IP_LIST) {
for (int i = 0; i < VIRTUAL_NODES; i++) {
nodeMap.put(getHash(serverIp + "VN" + i), serverIp);
}
}
for (String clientIp : CLIENT_IP_LIST) {
//这里利用的TreeMap的特性,不清楚的可以去自己去了解一下tailMap方法的作用
SortedMap<integer, String> subMap = nodeMap.tailMap(getHash(clientIp));
Integer firstKey = null;
try {
firstKey = subMap.firstKey();
} catch (Exception e) {
}
if (firstKey == null) {
firstKey = nodeMap.firstKey();
}
System.out.println("请求的服务器ip为" + nodeMap.get(firstKey));
}
}
到此,几种常用的负载均衡算法及代码实现都已介绍完毕!还有不清楚可以去某网下载示例代码自己调试:
https://github.com/sujing910206/load-balance
免费学习资源下载 点击↓↓↓
2020预备春招BAT面试题汇总:分布式+Dubbo +JVM+微服务+多线程+Spring(附答案)
上一篇: 简单排序之冒泡排序
下一篇: MYSQL的索引——深入浅出索引(上)