JAVA架构师眼中的高并发架构,分布式架构 应用服务器集群css
前言html
高并发常常会发生在有大活跃用户量,用户高汇集的业务场景中,如:秒杀活动,定时领取红包等。nginx
为了让业务能够流畅的运行而且给用户一个好的交互体验,咱们须要根据业务场景预估达到的并发量等因素,来设计适合本身业务场景的高并发处理方案。redis
在电商相关产品开发的这些年,我有幸的遇到了并发下的各类坑,这一路摸爬滚打过来有着很多的血泪史,这里进行的总结,做为本身的归档记录,同时分享给你们。算法
业务从发展的初期到逐渐成熟,服务器架构也是从相对单一到集群,再到分布式服务。 sql
一个能够支持高并发的服务少不了好的服务器架构,须要有均衡负载,数据库须要主从集群,nosql缓存须要主从集群,静态文件须要上传cdn,这些都是能让业务程序流畅运行的强大后盾。mongodb
服务器这块可能是须要运维人员来配合搭建,具体我就很少说了,点到为止。数据库
大体须要用到的服务器架构以下:浏览器
服务器缓存
均衡负载(如:nginx,阿里云SLB)
资源监控
分布式
数据库
主从分离,集群
DBA 表优化,索引优化,等
分布式
nosql
主从分离,集群
主从分离,集群
主从分离,集群
redis
mongodb
memcache
cdn
html
css
js
image
高并发相关的业务,须要进行并发的测试,经过大量的数据分析评估出整个架构能够支撑的并发量。
测试高并发可使用第三方服务器或者本身测试服务器,利用测试工具进行并发请求测试,分析测试数据获得能够支撑并发数量的评估,这个能够做为一个预警参考,俗话说知己自彼百战不殆。
第三方服务:
阿里云性能测试
并发测试工具:
Apache JMeter
Visual Studio性能负载测试
Microsoft Web Application Stress Tool
通用方案
日用户流量大,可是比较分散,偶尔会有用户高聚的状况;
场景: 用户签到,用户中心,用户订单,等
服务器架构图:
说明:
场景中的这些业务基本是用户进入APP后会操做到的,除了活动日(618,双11,等),这些业务的用户量都不会高汇集,同时这些业务相关的表都是大数据表,业务可能是查询操做,因此咱们须要减小用户直接命中DB的查询;优先查询缓存,若是缓存不存在,再进行DB查询,将查询结果缓存起来。
更新用户相关缓存须要分布式存储,好比使用用户ID进行hash分组,把用户分布到不一样的缓存中,这样一个缓存集合的总量不会很大,不会影响查询效率。
方案如:
用户签到获取积分
计算出用户分布的key,redis hash中查找用户今日签到信息
若是查询到签到信息,返回签到信息
若是没有查询到,DB查询今日是否签到过,若是有签到过,就把签到信息同步redis缓存。
若是DB中也没有查询到今日的签到记录,就进行签到逻辑,操做DB添加今日签到记录,添加签到积分(这整个DB操做是一个事务)
缓存签到信息到redis,返回签到信息
注意这里会有并发状况下的逻辑问题,如:一天签到屡次,发放屡次积分给用户。
个人博文《大话程序猿眼里的高并发》(http://blog.thankbabe.com/2016/04/01/high-concurrency/)有相关的处理方案。
用户订单
这里咱们只缓存用户第一页的订单信息,一页40条数据,用户通常也只会看第一页的订单数据
用户访问订单列表,若是是第一页读缓存,若是不是读DB
计算出用户分布的key,redis hash中查找用户订单信息
若是查询到用户订单信息,返回订单信息
若是不存在就进行DB查询第一页的订单数据,而后缓存redis,返回订单信息
用户中心
计算出用户分布的key,redis hash中查找用户订单信息
若是查询到用户信息,返回用户信息
若是不存在进行用户DB查询,而后缓存redis,返回用户信息
其余业务
上面例子可能是针对用户存储缓存,若是是公用的缓存数据须要注意一些问题,以下
注意公用的缓存数据须要考虑并发下的可能会致使大量命中DB查询,可使用管理后台更新缓存,或者DB查询的锁住操做。
个人博文《大话Redis进阶》(http://blog.thankbabe.com/2016/08/05/redis-up/)对更新缓存问题和推荐方案的分享。
以上例子是一个相对简单的高并发架构,并发量不是很高的状况能够很好的支撑,可是随着业务的壮大,用户并发量增长,咱们的架构也会进行不断的优化和演变,好比对业务进行服务化,每一个服务有本身的并发架构,本身的均衡服务器,分布式数据库,nosql主从集群,如:用户服务、订单服务;
消息队列
秒杀、秒抢等活动业务,用户在瞬间涌入产生高并发请求
场景:定时领取红包,等
服务器架构图:
说明:
场景中的定时领取是一个高并发的业务,像秒杀活动用户会在到点的时间涌入,DB瞬间就接受到一记暴击,hold不住就会宕机,而后影响整个业务;
像这种不是只有查询的操做而且会有高并发的插入或者更新数据的业务,前面提到的通用方案就没法支撑,并发的时候都是直接命中DB;
设计这块业务的时候就会使用消息队列的,能够将参与用户的信息添加到消息队列中,而后再写个多线程程序去消耗队列,给队列中的用户发放红包;
方案如:
定时领取红包
通常习惯使用 redis的 list
当用户参与活动,将用户参与信息push到队列中
而后写个多线程程序去pop数据,进行发放红包的业务
这样能够支持高并发下的用户能够正常的参与活动,而且避免数据库服务器宕机的危险
附加:
经过消息队列能够作不少的服务。
如:定时短信发送服务,使用sset(sorted set),发送时间戳做为排序依据,短信数据队列根据时间升序,而后写个程序定时循环去读取sset队列中的第一条,当前时间是否超过发送时间,若是超过就进行短信发送。
一级缓存
高并发请求链接缓存服务器超出服务器可以接收的请求链接量,部分用户出现创建链接超时没法读取到数据的问题;
所以须要有个方案当高并发时候时候能够减小命中缓存服务器;
这时候就出现了一级缓存的方案,一级缓存就是使用站点服务器缓存去存储数据,注意只存储部分请求量大的数据,而且缓存的数据量要控制,不能过度的使用站点服务器的内存而影响了站点应用程序的正常运行,一级缓存须要设置秒单位的过时时间,具体时间根据业务场景设定,目的是当有高并发请求的时候可让数据的获取命中到一级缓存,而不用链接缓存nosql数据服务器,减小nosql数据服务器的压力
好比APP首屏商品数据接口,这些数据是公共的不会针对用户自定义,并且这些数据不会频繁的更新,像这种接口的请求量比较大就能够加入一级缓存;
服务器架构图:
合理的规范和使用nosql缓存数据库,根据业务拆分缓存数据库的集群,这样基本能够很好支持业务,一级缓存毕竟是使用站点服务器缓存因此仍是要善用。
静态化数据
高并发请求数据不变化的状况下若是能够不请求本身的服务器获取数据那就能够减小服务器的资源压力。
对于更新频繁度不高,而且数据容许短期内的延迟,能够经过数据静态化成JSON,XML,HTML等数据文件上传CDN,在拉取数据的时候优先到CDN拉取,若是没有获取到数据再从缓存,数据库中获取,当管理人员操做后台编辑数据再从新生成静态文件上传同步到CDN,这样在高并发的时候可使数据的获取命中在CDN服务器上。
CDN节点同步有必定的延迟性,因此找一个靠谱的CDN服务器商也很重要
其余方案
对于更新频繁度不高的数据,APP,PC浏览器,能够缓存数据到本地,而后每次请求接口的时候上传当前缓存数据的版本号,服务端接收到版本号判断版本号与最新数据版本号是否一致,若是不同就进行最新数据的查询并返回最新数据和最新版本号,若是同样就返回状态码告知数据已是最新。减小服务器压力:资源、带宽
针对上面的技术我特地整理了一下,有不少技术不是靠几句话能讲清楚,因此干脆找朋友录制了一些视频,不少问题其实答案很简单,可是背后的思考和逻辑不简单,要作到知其然还要知其因此然。若是想学习Java工程化、高性能及分布式、深刻浅出。微服务、Spring,MyBatis,Netty源码分析的朋友能够加我微信进群:emprere,群里有阿里大牛直播讲解技术,以及Java大型互联网技术的视频免费分享给你们。
大型网站要很好支撑高并发,这是须要长期的规划设计
在初期就须要把系统进行分层,在发展过程当中把核心业务进行拆分红模块单元,根据需求进行分布式部署,能够进行独立团队维护开发。
分层
将系统在横向维度上切分红几个部分,每一个部门负责一部分相对简单并比较单一的职责,而后经过上层对下层的依赖和调度组成一个完整的系统
好比把电商系统分红:应用层,服务层,数据层。(具体分多少个层次根据本身的业务场景)
应用层:网站首页,用户中心,商品中心,购物车,红包业务,活动中心等,负责具体业务和视图展现
服务层:订单服务,用户管理服务,红包服务,商品服务等,为应用层提供服务支持
数据层:关系数据库,nosql数据库 等,提供数据存储查询服务
分层架构是逻辑上的,在物理部署上能够部署在同一台物理机器上,可是随着网站业务的发展,必然须要对已经分层的模块分离部署,分别部署在不一样的服务器上,使网站能够支撑更多用户访问
分割
在纵向方面对业务进行切分,将一块相对复杂的业务分割成不一样的模块单元
包装成高内聚低耦合的模块不只有助于软件的开发维护,也便于不一样模块的分布式部署,提升网站的并发处理能力和功能扩展
好比用户中心能够分割成:帐户信息模块,订单模块,充值模块,提现模块,优惠券模块等
分布式
分布式应用和服务,将分层或者分割后的业务分布式部署,独立的应用服务器,数据库,缓存服务器
当业务达到必定用户量的时候,再进行服务器均衡负载,数据库,缓存主从集群
分布式静态资源,好比:静态资源上传cdn
分布式计算,好比:使用hadoop进行大数据的分布式计算
分布式数据和存储,好比:各分布节点根据哈希算法或其余算法分散存储数据
网站分层-图1来自网络
对于用户访问集中的业务独立部署服务器,应用服务器,数据库,nosql数据库。 核心业务基本上须要搭建集群,即多台服务器部署相同的应用构成一个集群,经过负载均衡设备共同对外提供服务, 服务器集群可以为相同的服务提供更多的并发支持,所以当有更多的用户访问时,只须要向集群中加入新的机器便可, 另外能够实现当其中的某台服务器发生故障时,能够经过负载均衡的失效转移机制将请求转移至集群中其余的服务器上,所以能够提升系统的可用性
应用服务器集群
nginx 反向代理
slb
… …
(关系/nosql)数据库集群
主从分离,从库集群