【干货走一波】千万级用户的大型网站，应该如何设计其高并发架构？

时间 2019-11-17

标签干货走一波千万用户大型网站应该如何设计并发架构栏目网站开发繁體版

原文原文链接

公众号：狸猫技术窝
做者：原子弹大侠，阿里巴巴高级技术专家
数据库

目录（1）单块架构缓存

（2）初步的高可用架构服务器

（3）千万级用户量的压力预估架构

（4）服务器压力预估并发

（5）业务垂直拆分负载均衡

（6）用分布式缓存抗下读请求分布式

（7）基于数据库主从架构作读写分离高并发

（8）总结网站

本文将会从一个大型的网站发展历程出发，一步一步的探索这个网站的架构是如何从单体架构，演化到分布式架构，而后演化到高并发架构的。架构设计

（1）单块架构

通常一个网站刚开始创建的时候，用户量是不多的，大概可能就几万或者几十万的用户量，天天活跃的用户可能就几百或者几千个。

这个时候通常网站架构都是采用单体架构来设计的，总共就部署3台服务器，1台应用服务器，1台数据库服务器，1台图片服务器。

研发团队一般都在10人之内，就是在一个单块应用里写代码，而后写好以后合并代码，接着就是直接在线上的应用服务器上发布。极可能就是手动把应用服务器上的Tomcat给关掉，而后替换系统的代码war包，接着从新启动Tomcat。

数据库通常就部署在一台独立的服务器上，存放网站的所有核心数据。

而后在另一台独立的服务器上部署NFS做为图片服务器，存放网站的所有图片。应用服务器上的代码会链接以及操做数据库以及图片服务器。以下图所示：

（2）初步的高可用架构

可是这种纯单块系统架构下，有高可用问题存在，最大的问题就是应用服务器可能会故障，或者是数据库可能会故障

因此在这个时期，通常稍微预算充足一点的公司，都会作一个初步的高可用架构出来。

对于应用服务器而言，通常会集群化部署。固然所谓的集群化部署，在初期用户量不多的状况下，其实通常也就是部署两台应用服务器而已，而后前面会放一台服务器部署负载均衡设备，好比说LVS，均匀的把用户请求打到两台应用服务器上去。

若是此时某台应用服务器故障了，还有另一台应用服务器是可使用的，这样就避免了单点故障问题。以下图所示：

对于数据库服务器而言，此时通常也会使用主从架构，部署一台从库来从主库同步数据，这样一旦主库出现问题，能够迅速使用从库继续提供数据库服务，避免数据库故障致使整个系统都完全故障不可用。以下图：

（3）千万级用户量的压力预估

这个假设这个网站预估的用户数是1000万，那么根据28法则，天天会来访问这个网站的用户占到20%，也就是200万用户天天会过来访问。

一般假设平均每一个用户每次过来会有30次的点击，那么总共就有6000万的点击（PV）。

天天24小时，根据28法则，天天大部分用户最活跃的时间集中在（24小时 * 0.2）≈ 5小时内，而大部分用户指的是（6000万点击 * 0.8 ≈ 5000万点击）

也就是说，在5小时内会有5000万点击进来。

换算下来，在那5小时的活跃访问期内，大概每秒钟会有3000左右的请求量，而后这5小时中可能又会出现大量用户集中访问的高峰时间段。

好比在集中半个小时内大量用户涌入造成高峰访问。根据线上经验，通常高峰访问是活跃访问的2~3倍。假设咱们按照3倍来计算，那么5小时内可能有短暂的峰值会出现每秒有10000左右的请求。

（4）服务器压力预估

大概知道了高峰期每秒钟可能会有1万左右的请求量以后，来看一下系统中各个服务器的压力预估。

通常来讲一台虚拟机部署的应用服务器，上面放一个Tomcat，也就支撑最多每秒几百的请求。

按每秒支撑500的请求来计算，那么支撑高峰期的每秒1万访问量，须要部署20台应用服务。

并且应用服务器对数据库的访问量又是要翻几倍的，由于假设一秒钟应用服务器接收到1万个请求，可是应用服务器为了处理每一个请求可能要涉及到平均3~5次数据库的访问。

按照3次数据库访问来算，那么每秒会对数据库造成3万次的请求。

按照一台数据库服务器最高支撑每秒5000左右的请求量，此时须要经过6台数据库服务器才能支撑每秒3万左右的请求。

图片服务器的压力一样会很大，由于须要大量的读取图片展现页面，这个不太好估算，可是大体能够推算出来每秒至少也会有几千次请求，所以也须要多台图片服务器来支撑图片访问的请求。

（5）业务垂直拆分

通常来讲在这个阶段要作的第一件事儿就是业务的垂直拆分

由于若是全部业务代码都混合在一块儿部署，会致使多人协做开发时难以维护。在网站到了千万级用户的时候，研发团队通常都有几十人甚至上百人。

因此这时若是仍是在一个单块系统里作开发，是一件很是痛苦的事情，此时须要作的就是进行业务的垂直拆分，把一个单块系统拆分为多个业务系统，而后一个小团队10我的左右就专门负责维护一个业务系统。以下图

（6）分布式缓存扛下读请求

这个时候应用服务器层面通常没什么大问题，由于无非就是加机器就能够抗住更高的并发请求。

如今估算出来每秒钟是1万左右的请求，部署个二三十台机器就没问题了。

可是目前上述系统架构中压力最大的，实际上是数据库层面，由于估算出来可能高峰期对数据库的读写并发会有3万左右的请求。

此时就须要引入分布式缓存来抗下对数据库的读请求压力了，也就是引入Redis集群。

通常来讲对数据库的读写请求也大体遵循28法则，因此每秒3万的读写请求中，大概有2.4万左右是读请求

这些读请求基本上90%均可以经过分布式缓存集群来抗下来，也就是大概2万左右的读请求能够经过 Redis集群来抗住。

咱们彻底能够把热点的、常见的数据都在Redis集群里放一份做为缓存，而后对外提供缓存服务。

在读数据的时候优先从缓存里读，若是缓存里没有，再从数据库里读取。这样2万读请求就落到Redis上了，1万读写请求继续落在数据库上。

Redis通常单台服务器抗每秒几万请求是没问题的，因此Redis集群通常就部署3台机器，抗下每秒2万读请求是绝对没问题的。以下图所示：

（7）基于数据库主从架构作读写分离

此时数据库服务器仍是存在每秒1万的请求，对于单台服务器来讲压力仍是过大。

可是数据库通常都支持主从架构，也就是有一个从库一直从主库同步数据过去。此时能够基于主从架构作读写分离。

也就是说，每秒大概6000写请求是进入主库，大概还有4000个读请求是在从库上去读，这样就能够把1万读写请求压力分摊到两台服务器上去。

这么分摊事后，主库每秒最多6000写请求，从库每秒最多4000读请求，基本上能够勉强把压力给抗住。以下图：

（8）总结

本文主要是探讨在千万级用户场景下的大型网站的高并发架构设计，也就是预估出了千万级用户的访问压力以及对应的后台系统为了要抗住高并发，在业务系统、缓存、数据库几个层面的架构设计以及抗高并发的分析。

可是要记住，大型网站架构中共涉及的技术远远不止这些，还包括了MQ、CDN、静态化、分库分表、NoSQL、搜索、分布式文件系统、反向代理，等等不少话题，可是本文不能一一涉及，主要是在高并发这个角度分析一下系统如何抗下每秒上万的请求。

END

长按下图二维码，即刻关注【狸猫技术窝】阿里、京东、美团、字节跳动顶尖技术专家坐镇为IT人打造一个 “有温度” 的技术窝！