Java并发编程（8）- 应用限流及其常见算法

时间 2019-11-06

标签 java 并发编程应用限流及其常见算法栏目 Java 繁體版

原文原文链接

[TOC]java

应用限流

在开发高并发系统时，有三把利器用来保护系统：缓存、降级和限流：redis

缓存：缓存的目的是提高系统访问速度和增大系统处理容量
降级：降级是当服务出现问题或者影响到核心流程时，须要暂时屏蔽掉，待高峰或者问题解决后再打开
限流：限流的目的是经过对并发访问/请求进行限速，或者对一个时间窗口内的请求进行限速来保护系统，一旦达到限制速率则能够拒绝服务、排队或等待、降级等处理

本文仅针对限流作一些简单的说明，那么何为限流呢？顾名思义，限流就是限制流量，就像你宽带包了1个G的流量，用完了就没了。经过限流，咱们能够很好地控制系统的qps，从而达到保护系统的目的。本篇文章将会介绍一下经常使用的限流算法以及他们各自的特色。算法

限流本质上是控制某段代码在必定时间内执行的次数，例如咱们系统天天五点事后都有130w~140w的数据须要插入数据库，如果直接一次性插入这些数据，必将致使数据库链接被占满没法接收其余处理的请求，数据库的负载压力会瞬间飙升，甚至是压垮数据库形成雪崩现象。因此咱们须要对此操做进行限流，以一个恒定的速率去插入数据，假设每秒插入400条数据，固然这个数值须要根据实际状况去设定，如此一来就能够有效控制同一时间往数据库插入的数据流不会很大，这样就不会出现上述问题了。以下图：
数据库

应用限流的经常使用算法：编程

计数器法
滑动窗口
漏桶算法
令牌桶算法

计数器法

计数器法是限流算法里最简单也是最容易实现的一种算法。好比咱们规定，对于A接口来讲，咱们1分钟的访问次数不能超过100个。那么咱们能够这么作：在一开始的时候，咱们能够设置一个计数器counter，每当一个请求过来的时候，counter就加1，若是counter的值大于100而且该请求与第一个请求的间隔时间还在1分钟以内，那么说明请求数过多；若是该请求与第一个请求的间隔时间大于1分钟，且counter的值还在限流范围内，那么就重置 counter，具体算法的示意图以下：
缓存

具体的伪代码以下：服务器

public class CounterDemo {
    public long timeStamp = getNowTime();  // 当前时间
    public int reqCount = 0;  // 初始化计数器
    public final int limit = 100; // 时间窗口内最大请求数
    public final long interval = 1000; // 时间窗口ms

    public boolean grant() {
        long now = getNowTime();
        if (now < timeStamp + interval) {
            // 在时间窗口内
            reqCount++;
            // 判断当前时间窗口内是否超过最大请求控制数
            return reqCount <= limit;
        } else {
            timeStamp = now;
            // 超时后重置
            reqCount = 1;
            return true;
        }
    }
}

这个算法虽然简单，可是有一个十分致命的问题，那就是临界问题，以下图：
网络

从上图中咱们能够看到，假设有一个恶意用户，他在0:59时，瞬间发送了100个请求，而且1:00又瞬间发送了100个请求，那么其实这个用户在 1秒里面，瞬间发送了200个请求。咱们刚才规定的是1分钟最多100个请求，也就是每秒钟最多1.7个请求，用户经过在时间窗口的重置节点处突发请求，能够瞬间超过咱们的速率限制。用户有可能经过算法的这个漏洞，瞬间压垮咱们的应用。并发

聪明的朋友可能已经看出来了，刚才的问题实际上是由于咱们统计的精度过低。那么如何很好地处理这个问题呢？或者说，如何将临界问题的影响下降呢？咱们能够看下面的滑动窗口算法。ide

滑动窗口

滑动窗口，又称rolling window。为了解决计数器法统计精度过低的问题，引入了滑动窗口算法。若是学过TCP网络协议的话，那么必定对滑动窗口这个名词不会陌生。下面这张图，很好地解释了滑动窗口算法：

在上图中，整个红色的矩形框表示一个时间窗口，在咱们的例子中，一个时间窗口就是一分钟。而后咱们将时间窗口进行划分，好比图中，咱们就将滑动窗口划成了6格，因此每格表明的是10秒钟。每过10秒钟，咱们的时间窗口就会往右滑动一格。每个格子都有本身独立的计数器counter，好比当一个请求在0:35秒的时候到达，那么0:30~0:39对应的counter就会加1。

那么滑动窗口怎么解决刚才的临界问题的呢？在上图中，0:59到达的100个请求会落在灰色的格子中，而1:00到达的请求会落在橘×××的格子中。当时间到达1:00时，咱们的窗口会往右移动一格，那么此时时间窗口内的总请求数量一共是200个，超过了限定的100个，因此此时可以检测出来触发了限流。

我再来回顾一下刚才的计数器算法，咱们能够发现，计数器算法其实就是滑动窗口算法。只是它没有对时间窗口作进一步地划分，因此只有1格。

因而可知，当滑动窗口的格子划分的越多，那么滑动窗口的滚动就越平滑，限流的统计就会越精确。

漏桶算法

漏桶算法，又称leaky bucket。为了理解漏桶算法，咱们看一下对于该算法的示意图：

从图中咱们能够看到，整个算法其实十分简单。首先，咱们有一个固定容量的桶，有水流进来，也有水流出去。对于流进来的水来讲，咱们没法预计一共有多少水会流进来，也没法预计水流的速度。可是对于流出去的水来讲，这个桶能够固定水流出的速率。并且，当桶满了以后，多余的水将会溢出。

咱们将算法中的水换成实际应用中的请求，咱们能够看到漏桶算法天生就限制了请求的速度。当使用了漏桶算法，咱们能够保证接口会以一个常速速率来处理请求。因此漏桶算法天生不会出现临界问题。

具体的伪代码以下：

public class LeakyDemo {
        public long timeStamp = getNowTime();  // 当前时间
        public int capacity; // 桶的容量
        public int rate; // 水漏出的速度
        public int water; // 当前水量(当前累积请求数)

        public boolean grant() {
            long now = getNowTime();
            water = max(0, water - (now - timeStamp) * rate); // 先执行漏水，计算剩余水量
            timeStamp = now;
            if ((water + 1) < capacity) {
                // 尝试加水,而且水还未满
                water += 1;
                return true;
            } else {
                // 水满，拒绝加水
                return false;
        }
    }
}

令牌桶算法

令牌桶算法，又称token bucket。一样为了理解该算法，咱们来看一下该算法的示意图：

从图中咱们能够看到，令牌桶算法比漏桶算法稍显复杂。首先，咱们有一个固定容量的桶，桶里存放着令牌（token）。桶一开始是空的，token以一个固定的速率r往桶里填充，直到达到桶的容量，多余的令牌将会被丢弃。每当一个请求过来时，就会尝试从桶里移除一个令牌，若是没有令牌的话，请求没法经过。

具体的伪代码以下：

public class TokenBucketDemo {
    public long timeStamp = getNowTime();  // 当前时间
    public int capacity; // 桶的容量
    public int rate; // 令牌放入速度
    public int tokens; // 当前令牌数量

    public boolean grant() {
        long now = getNowTime();
        // 先添加令牌
        tokens = min(capacity, tokens + (now - timeStamp) * rate);
        timeStamp = now;
        if (tokens < 1) {
            // 若不到1个令牌,则拒绝
            return false;
        } else {
            // 还有令牌，领取令牌
            tokens -= 1;
            return true;
        }
    }
}

若仔细研究算法，咱们会发现咱们默认从桶里移除令牌是不须要耗费时间的。若是给移除令牌设置一个延时时间，那么实际上又采用了漏桶算法的思路。Google的Guava库下的SmoothWarmingUp类就采用了这个思路。

咱们再来考虑一下临界问题的场景。在0:59秒的时候，因为桶内积满了100个token，因此这100个请求能够瞬间经过。可是因为token是以较低的速率填充的，因此在1:00的时候，桶内的token数量不可能达到100个，那么此时不可能再有100个请求经过。因此令牌桶算法能够很好地解决临界问题。下图比较了计数器（左）和令牌桶算法（右）在临界点的速率变化。咱们能够看到虽然令牌桶算法容许突发速率，可是下一个突发速率必需要等桶内有足够的 token后才能发生：

限流算法小结

计数器 VS 滑动窗口：

计数器算法是最简单的算法，能够当作是滑动窗口的低精度实现。滑动窗口因为须要存储多份的计数器（每个格子存一份），因此滑动窗口在实现上须要更多的存储空间。也就是说，若是滑动窗口的精度越高，须要的存储空间就越大。

漏桶算法 VS 令牌桶算法：

漏桶算法和令牌桶算法最明显的区别是令牌桶算法容许流量必定程度的突发。由于默认的令牌桶算法，取走token是不须要耗费时间的，也就是说，假设桶内有100个token时，那么能够瞬间容许100个请求经过。

令牌桶算法因为实现简单，且容许某些流量的突发，对用户友好，因此被业界采用地较多。固然咱们须要具体状况具体分析，只有最合适的算法，没有最优的算法。

RateLimiter使用示例

Google开源工具包Guava提供了限流工具类RateLimiter，该类基于令牌桶算法(Token Bucket)来完成限流，很是易于使用。RateLimiter常常用于限制对一些物理资源或者逻辑资源的访问速率，它支持两种获取permits接口，一种是若是拿不到马上返回false（tryAcquire()），一种会阻塞等待一段时间看能不能拿到（tryAcquire(long timeout, TimeUnit unit)）。

使用tryAcquire方法获取令牌的示例代码：

@Slf4j
public class RateLimiterExample1 {
    /**
     * 每秒钟放入5个令牌，至关于每秒只容许执行5个请求
     */
    private static final RateLimiter RATE_LIMITER = RateLimiter.create(5);

    public static void main(String[] args) {
        // 模拟有100个请求
        for (int i = 0; i < 100; i++) {
            // 尝试从令牌桶中获取令牌，若获取不到则等待300毫秒看能不能获取到
            if (RATE_LIMITER.tryAcquire(300, TimeUnit.MILLISECONDS)) {
                // 获取成功，执行相应逻辑
                handle(i);
            }
        }
    }

    private static void handle(int i) {
        log.info("{}", i);
    }
}

若想保证全部的请求都被执行，而不会被抛弃的话，能够选择使用acquire方法：

@Slf4j
public class RateLimiterExample2 {
    /**
     * 每秒钟放入5个令牌，至关于每秒只容许执行5个请求
     */
    private static final RateLimiter RATE_LIMITER = RateLimiter.create(5);

    public static void main(String[] args) {
        for (int i = 0; i < 100; i++) {
            // 从令牌桶中获取一个令牌，若没有获取到会阻塞直到获取到为止，因此全部的请求都会被执行
            RATE_LIMITER.acquire();
            // 获取成功，执行相应逻辑
            handle(i);
        }
    }

    private static void handle(int i) {
        log.info("{}", i);
    }
}

集群限流

前面讨论的几种算法都属于单机限流的范畴，可是业务需求五花八门，简单的单机限流，根本没法知足他们。

好比为了限制某个资源被每一个用户或者商户的访问次数，5s只能访问2次，或者一天只能调用1000次，这种需求，单机限流是没法实现的，这时就须要经过集群限流进行实现。

如何实现？为了控制访问次数，确定须要一个计数器，并且这个计数器只能保存在第三方服务，好比redis。

大概思路：每次有相关操做的时候，就向redis服务器发送一个incr命令，好比须要限制某个用户访问/index接口的次数，只须要拼接用户id和接口名生成redis的key，每次该用户访问此接口时，只须要对这个key执行incr命令，在这个key带上过时时间，就能够实现指定时间的访问频率。