首发于 樊浩柏科学院
在 负载均衡算法 — 轮询 一文中,咱们就指出了加权轮询算法一个明显的缺陷。即在某些特殊的权重下,加权轮询调度会生成不均匀的实例序列,这种不平滑的负载可能会使某些实例出现瞬时高负载的现象,致使系统存在宕机的风险。为了解决这个调度缺陷,就提出了 平滑加权轮询 调度算法。php
为了说明平滑加权轮询调度的平滑性,使用如下 3 个特殊的权重实例来演示调度过程。html
服务实例 | 权重值 |
---|---|
192.168.10.1:2202 | 5 |
192.168.10.2:2202 | 1 |
192.168.10.3:2202 | 1 |
咱们已经知道经过 加权轮询 算法调度后,会生成以下不均匀的调度序列。nginx
请求 | 选中的实例 |
---|---|
1 | 192.168.10.1:2202 |
2 | 192.168.10.1:2202 |
3 | 192.168.10.1:2202 |
4 | 192.168.10.1:2202 |
5 | 192.168.10.1:2202 |
6 | 192.168.10.2:2202 |
7 | 192.168.10.3:2202 |
接下来,咱们就使用平滑加权轮询算法调度上述实例,看看生成的实例序列如何?git
假设有 N 台实例 S = {S1, S2, …, Sn},配置权重 W = {W1, W2, …, Wn},有效权重 CW = {CW1, CW2, …, CWn}。每一个实例 i 除了存在一个配置权重 Wi 外,还存在一个当前有效权重 CWi,且 CWi 初始化为 Wi;指示变量 currentPos 表示当前选择的实例 ID,初始化为 -1;全部实例的配置权重和为 weightSum;github
那么,调度算法能够描述为:
一、初始每一个实例 i 的 当前有效权重 CWi 为 配置权重 Wi,并求得配置权重和 weightSum;
二、选出 当前有效权重 最大 的实例,将 当前有效权重 CWi 减去全部实例的 权重和 weightSum,且变量 currentPos 指向此位置;
三、将每一个实例 i 的 当前有效权重 CWi 都加上 配置权重 Wi;
四、此时变量 currentPos 指向的实例就是需调度的实例;
五、每次调度重复上述步骤 二、三、4;算法
上述 3 个服务,配置权重和 weightSum 为 7,其调度过程以下:数组
请求 | 选中前的当前权重 | currentPos | 选中的实例 | 选中后的当前权重 |
---|---|---|---|---|
1 | {5, 1, 1} | 0 | 192.168.10.1:2202 | {-2, 1, 1} |
2 | {3, 2, 2} | 0 | 192.168.10.1:2202 | {-4, 2, 2} |
3 | {1, 3, 3} | 1 | 192.168.10.2:2202 | {1, -4, 3} |
4 | {6, -3, 4} | 0 | 192.168.10.1:2202 | {-1, -3, 4} |
5 | {4, -2, 5} | 2 | 192.168.10.3:2202 | {4, -2, -2} |
6 | {9, -1, -1} | 0 | 192.168.10.1:2202 | {2, -1, -1} |
7 | {7, 0, 0} | 0 | 192.168.10.1:2202 | {0, 0, 0} |
8 | {5, 1, 1} | 0 | 192.168.10.1:2202 | {-2, 1, 1} |
能够看出上述调度序列分散是很是均匀的,且第 8 次调度时当前有效权重值又回到 {0, 0, 0},实例的状态同初始状态一致,因此后续能够一直重复调度操做。负载均衡
此轮询调度算法思路首先被 Nginx 开发者提出,见 phusion/nginx 部分。
这里使用 PHP 来实现,源码见 fan-haobai/load-balance 部分。学习
class SmoothWeightedRobin implements RobinInterface { private $services = array(); private $total; private $currentPos = -1; public function init(array $services) { foreach ($services as $ip => $weight) { $this->services[] = [ 'ip' => $ip, 'weight' => $weight, 'current_weight' => $weight, ]; } $this->total = count($this->services); } public function next() { // 获取最大当前有效权重实例的位置 $this->currentPos = $this->getMaxCurrentWeightPos(); // 当前权重减去权重和 $currentWeight = $this->getCurrentWeight($this->currentPos) - $this->getSumWeight(); $this->setCurrentWeight($this->currentPos, $currentWeight); // 每一个实例的当前有效权重加上配置权重 $this->recoverCurrentWeight(); return $this->services[$this->currentPos]['ip']; } }
其中,getSumWeight()
为全部实例的配置权重和;getCurrentWeight()
和 setCurrentWeight()
分别用于获取和设置指定实例的当前有效权重;getMaxCurrentWeightPos()
求得最大当前有效权重的实例位置,实现以下:this
public function getMaxCurrentWeightPos() { $currentWeight = $pos = 0; foreach ($this->services as $index => $service) { if ($service['current_weight'] > $currentWeight) { $currentWeight = $service['current_weight']; $pos = $index; } } return $pos; }
recoverCurrentWeight()
用于调整每一个实例的当前有效权重,即加上配置权重,实现以下:
public function recoverCurrentWeight() { foreach ($this->services as $index => &$service) { $service['current_weight'] += $service['weight']; } }
须要注意的是,在配置services
服务列表时,一样须要指定其权重:
$services = [ '192.168.10.1:2202' => 5, '192.168.10.2:2202' => 1, '192.168.10.3:2202' => 1, ];
惋惜的是,关于此调度算法严谨的数学证实少之又少,不过网友 tenfy 给出的 安大神 证实过程,很是值得参考和学习。
假若有 n 个结点,记第 i 个结点的权重是 $x_i$,设总权重为 $S = x_1 + x_2 + … + x_n$。选择分两步:
一、为每一个节点加上它的权重值;
二、选择最大的节点减去总的权重值;
n 个节点的初始化值为 [0, 0, …, 0],数组长度为 n,值都为 0。第一轮选择的第 1 步执行后,数组的值为 $[x_1, x_2, …, x_n]$。
假设第 1 步后,最大的节点为 j,则第 j 个节点减去 S。
因此第 2 步的数组为 $[x_1, x_2, …, x_j-S, …, x_n]$。 执行完第 2 步后,数组的和为:
$x_1 + x_2 + … + x_j-S + … + x_n => x_1 + x_2 + … + x_n - S = S - S = 0$
因而可知,每轮选择第 1 步操做都是数组的总和加上 S,第 2 步总和再减去 S,因此每轮选择完后的数组总和都为 0。
假设总共执行 S 轮选择,记第 i 个结点选择 $m_i$ 次。第 i 个结点的当前权重为 $w_i$。 假设节点 j 在第 t 轮(t < S)以前,已经被选择了 $x_j$ 次,记此时第 j 个结点的当前权重为 $w_j = t \* x_j - x_j \* S = (t - S) \* x_j < 0$, 由于 t 恒小于 S,因此 $w_j < 0$。
前面假设总共执行 S 轮选择,则剩下 S-t 轮 j 都不会被选中,上面的公式 $w_j = (t - S) \* x_j + (S - t) \* x_j = 0$。 因此在剩下的选择中,$w_j$ 永远小于等于 0,因为上面已经证实任何一轮选择后,数组总和都为 0,则一定存在一个节点 k 使得 $w_k > 0$,永远不会再选中节点 j。
由此能够得出,第 i 个结点最多被选中 $x_i$ 次,即 $m_i <= x_i$。
由于 $S = m_1 + m_2 + … + m_n$ 且 $S = x_1 + x_2 + … + x_n$。 因此,能够得出 $m_i == x_i$。
证实平滑性,只要证实不要一直都是连续选择那一个节点便可。
跟上面同样,假设总权重为 S,假如某个节点 i 连续选择了 t($t < x_i$) 次,只要存在下一次选择的不是节点 i,便可证实是平滑的。
假设 $t = x_i - 1$,此时第 i 个结点的当前权重为 $w_i = t \* x_i - t \* S = (x_i - 1) \* x_i - (x_i - 1) \* S$。证实下一轮的第 1 步执行完的值 $w_i + x_i$ 不是最大的便可。
$w_i + x_i => (x_i - 1) \* x_i - (x_i - 1) \* S + x_i =>$
$x_i^2 - x_i \* S + S => (x_i - 1) \* (x_i - S) + x_i$
由于 $x_i$ 恒小于 S,因此 $x_i - S <= -1$。 因此上面:
$(x_i - 1) \* (x_i - S) + x_i <= (x_i - 1) \* -1 + x_i = -x_i + 1 + x_i = 1$
因此第 t 轮后,再执行完第 1 步的值 $w_i + x_i <= 1$。
若是这 t 轮恰好是最开始的 t 轮,则一定存在另外一个结点 j 的值为 $x_j \* t$,因此有 $w_i + x_i <= 1 < 1 \* t < x_j \* t$。因此下一轮确定不会选中 i。
尽管,平滑加权轮询算法改善了加权轮询算法调度的缺陷,即调度序列分散的不均匀,避免了实例负载忽然加剧的可能,可是仍然不能动态感知每一个实例的负载。
若因为实例权重配置不合理,或者一些其余缘由加剧系统负载的状况,平滑加权轮询都没法实现每一个实例的负载均衡,这时就须要 有状态 的调度算法来完成。
相关文章 »