【58沈剑架构系列】一分钟了解负载均衡的一切

什么是负载均衡nginx

负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它一般是指,将请求/数据【均匀】分摊到多个操做单元上执行,负载均衡的关键在于【均匀】。web

常见的负载均衡方案微信

常见互联网分布式架构如上,分为客户端层、反向代理nginx层、站点层、服务层、数据层。能够看到,每个下游都有多个上游调用,只须要作到,每个上游都均匀访问每个下游,就能实现“将请求/数据【均匀】分摊到多个操做单元上执行”。session

【客户端层->反向代理层】的负载均衡架构

【客户端层】到【反向代理层】的负载均衡,是经过“DNS轮询”实现的:DNS-server对于一个域名配置了多个解析ip,每次DNS解析请求来访问DNS-server,会轮询返回这些ip,保证每一个ip的解析几率是相同的。这些ip就是nginx的外网ip,以作到每台nginx的请求分配也是均衡的。负载均衡

【反向代理层->站点层】的负载均衡分布式

【反向代理层】到【站点层】的负载均衡,是经过“nginx”实现的。经过修改nginx.conf,能够实现多种负载均衡策略:ui

1)请求轮询:和DNS轮询相似,请求依次路由到各个web-server架构设计

2)最少链接路由:哪一个web-server的链接少,路由到哪一个web-server设计

3)ip哈希:按照访问用户的ip哈希值来路由web-server,只要用户的ip分布是均匀的,请求理论上也是均匀的,ip哈希均衡方法能够作到,同一个用户的请求固定落到同一台web-server上,此策略适合有状态服务,例如session(58沈剑备注:能够这么作,但强烈不建议这么作,站点层无状态是分布式架构设计的基本原则之一,session最好放到数据层存储)

4)…

【站点层->服务层】的负载均衡


【站点层】到【服务层】的负载均衡,是经过“服务链接池”实现的。

上游链接池会创建与下游服务多个链接,每次请求会“随机”选取链接来访问下游服务。

上一篇文章《RPC-client实现细节》中有详细的负载均衡、故障转移、超时处理的细节描述,欢迎点击link查阅,此处再也不展开。

【数据层】的负载均衡

在数据量很大的状况下,因为数据层(db,cache)涉及数据的水平切分,因此数据层的负载均衡更为复杂一些,它分为“数据的均衡”,与“请求的均衡”。

数据的均衡是指:水平切分后的每一个服务(db,cache),数据量是差很少的。

请求的均衡是指:水平切分后的每一个服务(db,cache),请求量是差很少的。

业内常见的水平切分方式有这么几种:

1、按照range水平切分

每个数据服务,存储必定范围的数据,上图为例:

user0服务,存储uid范围1-1kw

user1服务,存储uid范围1kw-2kw

这个方案的好处是:

(1)规则简单,service只需判断一下uid范围就能路由到对应的存储服务

(2)数据均衡性较好

(3)比较容易扩展,能够随时加一个uid[2kw,3kw]的数据服务

不足是:

(1)请求的负载不必定均衡,通常来讲,新注册的用户会比老用户更活跃,大range的服务请求压力会更大

2、按照id哈希水平切分

每个数据服务,存储某个key值hash后的部分数据,上图为例:

user0服务,存储偶数uid数据

user1服务,存储奇数uid数据

这个方案的好处是:

(1)规则简单,service只需对uid进行hash能路由到对应的存储服务

(2)数据均衡性较好

(3)请求均匀性较好

不足是:

(1)不容易扩展,扩展一个数据服务,hash方法改变时候,可能须要进行数据迁移

总结

负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它一般是指,将请求/数据【均匀】分摊到多个操做单元上执行,负载均衡的关键在于【均匀】。

(1)【客户端层】到【反向代理层】的负载均衡,是经过“DNS轮询”实现的

(2)【反向代理层】到【站点层】的负载均衡,是经过“nginx”实现的

(3)【站点层】到【服务层】的负载均衡,是经过“服务链接池”实现的

(4)【数据层】的负载均衡,要考虑“数据的均衡”与“请求的均衡”两个点,常见的方式有“按照范围水平切分”与“hash水平切分”

 

【文章转载自微信公众号“架构师之路”】

相关文章
相关标签/搜索