大流量场景下如何云淡风轻地进行线上发布？

时间 2021-01-20

标签 git github 算法 shell json 网络架构负载均衡 curl 微服务栏目 Git 繁體版

原文原文链接

简介：本文介绍了微服务治理下金丝雀发布的能力，解决了发布期间少许流量验证新功能的问题。git

不少互联网公司在半夜发布的另一个重要缘由是不具有可灰度能力，新版本存在 bug 或者其它缘由会影响线上的客户，无奈之下只能选择在半夜进行发布来减小影响面。github

咱们知道默认状况下，不管是 Kubernetes 仍是 ECS，新老版本都存在的状况下会根据特定的负载均衡算法随机地路由到不一样的实例上，随机意味着出问题也会随机出现。咱们须要一套动态路由来完成灰度发布的解决方案。算法

在 RPC 领域，咱们称灰度发布为动态路由，动态路由的意思是指流量能够动态地路由到指定的实例上。shell

动态路由场景

动态路由是微服务里很是核心的功能，流量动态路由意味着能够作很是多的事情。由此衍生出各个场景:json

金丝雀发布：只有知足特定规则(好比 Query Parameter、HEADER、COOKIE 中某些 KEY 知足一些条件)或者是固定流量比例的流量才会进入新版本，其它流量都路由到老版本上。

同机房优先路由：当公司规模扩大以后，应用会跨机房部署来达到高可用的目的。因为异地跨机房调用出现的网络延迟问题，须要确保服务消费方能优先调用相同机房的服务消费方，这就须要同机房优先路由的能力。

标签路由：金丝雀发布的新场景。金丝雀发布通常只有新和老两个版本，标签路由能够在线上部署多个版本，每一个版本都对于一个标签。
全链路灰度：在业务比较复杂，服务调用链路较长的场景下，每一个应用都须要设置路由规则会显得很是繁琐，全链路灰度在金丝雀/标签路由的基础上加上了 "标签透传" 的能力，让灰度流量只在灰度版本之间路由。

接下来我会分几篇文章详细讲一下这几个场景，今天咱们先来聊聊金丝雀发布。金丝雀发布可让咱们在白天流量高峰喝着茶吃着瓜子进行线上发布，不须要在半夜为发布的事情而苦恼。网络

大流量下的应用部署现状

应用 Demo

Demo 以 Spring Cloud 为例，服务调用链路以下图所示：架构

流量从 Netflix Zuul 对应的 Ingress 进来，会调用 SC-A 应用对应的服务，SC-A 应用内部调用 SC-B 应用的服务，SC-B 应用内部调用 SC-C 应用的服务。SC-A 有线上版本和灰度版本这两个版本。负载均衡

Helm 部署 Demo

Demo 为纯开源 Spring Cloud 架构，项目地址：https://github.com/aliyun/alibabacloud-microservice-demo/tree/master/microservice-doc-demo/traffic-management。curl

部署完毕后，阿里云容器服务上的工做负载状况以下：微服务

咱们经过 "while true; do curl http://{ip:port}/A/a;echo;done" shell 命令不断地去访问 Spring Cloud 服务，各个服务的做用仅仅是打印当前服务的IP，这样咱们能够看到总体调用链路:

while true; do curl http://{ip:port}/A/a;echo;done
A[10.0.0.73] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A[10.0.0.73] -> B[10.0.0.180] -> C[10.0.0.72]
A[10.0.0.73] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A[10.0.0.73] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A[10.0.0.73] -> B[10.0.0.180] -> C[10.0.0.72]
...

从这个过程咱们明显能够看出 Netflix Zuul -> SC-A 这条链路是随机访问的，因为 SC-A 的线上版本和灰度版本各只有 1 个 Pod，因此随机打印了这两个 POD 的 IP。

开源金丝雀的实现

动态路由的本质就是寻址过程当中去找符合条件的实例地址。

Apache Dubbo 提供了 RouterChain 的能力去过滤 Invoker 列表，RouterChain 内部维护着 Router 列表，每一个 Router 都会作过滤 Invoker 的逻辑，最后将 Invoker 列表交付给 LoadBalance 作负载均衡获取最后的 Invoker。

ScriptRouter，ConditionRouter 和 TagRouter 这些内置的 Router 内部都是 Dubbo 自带的动态路由能力。

Spring Cloud 的路由能力由 Ribbon 实现。Ribbon 设计了 ILoadBalancer 接口用于获取 Server 列表，最后将这个列表交付给 IRule 作负载均衡策略获取最后的 Server。这块在设计上跟 Dubbo 相比是有缺陷的。

Spring Cloud Ribbon 里的 ILoadBalancer 至关因而 Dubbo RouterChain 里的一个 Router，IRule 至关因而 Dubbo LoadBalance。

最新版本的 Spring Cloud 新增了 Spring Cloud LoadBalancer 组件代替 Ribbon 用于作负载均衡，Spring Cloud LoadBalancer 里的 ServiceInstanceListSupplier 用于获取实例列表信息，ReactiveLoadBalancer 使用负载均衡策略获取最后的实例。

这是 3 者对应组件的说明:

Apache Dubbo 虽然内置了各类 Router，但实际使用下来却有很是多的问题。好比 TagRouter 跟 IP 绑定，在 Kubernetes 下没法工做；ScriptRouter 用了 ScriptEngine 去作脚本的处理，会有性能问题；Dubbo Admin 的使用体验很是糟糕等等。

Spring Cloud 官方并无提供动态路由的能力，只有社区上的一些开发者本身去扩展了这个能力，社区上也没有任何的 UI 交互界面。

这时候 MSE 告诉你，MSE 的微服务解决方案提供了动态路由的能力，不须要作任何的代码和配置的修改，就能使用 OPEN API 或者 UI 交互去完成金丝雀发布。只需将您的应用接入 MSE 服务治理，您就能享受到金丝雀能力。

只要你的应用是基于 Spring Cloud 或 Dubbo 最近五年内的版本开发，就能直接使用完整的 MSE 微服务治理能力，不须要修改任何代码和配置。

无需任何代码修改就能够作到动态路由的能力，这不香吗？

MSE 金丝雀能力

应用接入 MSE 便可享受 MSE 提供的动态路由能力，无需任何代码修改。

引入标签概念

MSE 引入了标签的概念，能够针对每一个标签设置路由规则，知足该路由规则的流量会路由到这个标签对应的实例下。咱们将 Spring Cloud Demo 进行一点改造，给 SC-A 的灰度版本打上 "blue" 标签( Helm 已经完成了这个步骤)。

接入 MSE 后，MSE 默认会给应用分配一个 100% 路由到未打标实例的路由规则。此时，咱们继续经过 "while true; do curl http://{ip:port}/A/a;echo;done" shell 命令去执行，这个时候调用 SC-A 所有返回线上版本的 IP:

while true; do curl http://{ip:port}/A/a;echo;done
A[10.0.0.73] -> B[10.0.0.180] -> C[10.0.0.72]
A[10.0.0.73] -> B[10.0.0.180] -> C[10.0.0.72]
A[10.0.0.73] -> B[10.0.0.180] -> C[10.0.0.72]
A[10.0.0.73] -> B[10.0.0.180] -> C[10.0.0.72]
A[10.0.0.73] -> B[10.0.0.180] -> C[10.0.0.72]
...

设置金丝雀路由规则

咱们在 MSE 上的应用详情页里的金丝雀 Tab 页里设置 HEADER 里 env 这个 KEY 的值为 test 的金丝雀路由条件:

传入 HEADER 继续使用 shell 执行:

while true; do curl -H "env:test" http://139.196.200.40/A/a;echo;done
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
A1[10.0.0.20] -> B[10.0.0.180] -> C[10.0.0.72]
...

这个时候咱们发现知足金丝雀规则的流量都去了 SC-A 的灰度版本。

金丝雀路由规则解析

你们看到金丝雀路由规则界面上有两种分别，分别是流量比例和流量规则:

流量规则：表示知足该规则的流量会路由到对应标签(本文使用 blue 做为灰度标签)实例上。好比本文例子中 HEADER 里 env=test 的流量必定会去 blue 标签对应的实例。

流量比例：不知足任何流量规则的流量会按照流量百分比进行路由。好比本文例子中不知足 HEADER 里 env=test 的流量会以 100% 的规则路由到未打标的实例上，因为是 100%，因此那些不知足规则的流量所有都去了未打标实例上(本文未打标表示线上版本)。

MSE 提供的流量规则里的条件支持 HEADER、Query Parameter、COOKIE 以及 Request BODY。

Query Parameter、HEADER、COOKIE 和 Request Body 除了支持常规的运算符外，还支持 in(白名单)，对 100 取模和百分比。这里的百分比并非比例规则中的总流量百分比，而是指对应参数的 hash 值取模，这样就可让固定的值永远知足路由条件(若是按照流量比例，用户 A 此次访问的是线上版本，下次可能会访问灰度版本)。举个例子，若是 HEADER 中带有用户 ID，我让想部分用户永远可以访问灰度实例，这个时候能够对用户 ID 的 hash 值取模去完成(固然，这个也能够经过白名单去操做，白名单的缺点并不随机，须要输入各个名单)。

Request Body 目前支持解析 json 字符串，好比以下字符串:

{  
  "a": "aa",
  "b": [
    1,2,3
  ],
  "c": [
    {
      "d": "dd"
    }
  ],
  "e": {
    "f": "ff"
  }
}

JSON 访问表达式 .a 的值为 aa。
JSON 访问表达式 .b[0] 的值为 1。
JSON 访问表达式 .c[0].d 的值为 dd。
JSON 访问表达式 .e.f 的值为 ff。

总结

本文介绍了微服务治理下金丝雀发布的能力，解决了发布期间少许流量验证新功能的问题。您的应用只需接入 MSE 服务治理，无需任何操做便可享受到动态路由的能力。除了 MSE（微服务引擎），金丝雀发布还被 EDAS、SAE 等云产品集成。

做者：中间件小哥

原文连接

本文为阿里云原创内容，未经容许不得转载