做者:若汐缘
https://www.jianshu.com/p/796...
以淘宝网为例,简单了解一下大型电商的服务端架构是怎样的。如图所示
最上面的就是安全体系系统,中间的就是业务运营系统,包含各个不一样的业务服务,下面是一些共享服务,而后还有一些中间件,其中 ECS 就是云服务器,MQS 是队列服务,OCS 是缓存等等,右侧是一些支撑体系服务。java
除图中所示以外还包含一些咱们看不到的,好比高可用的体现。淘宝目前已经实现多机房容灾和异地机房单元化部署,为淘宝的业务也提供了稳定、高效和易于维护的基础架构支撑。web
这是一个含金量很是高的架构,也是一个很是复杂而庞大的架构,固然这个架构不是一天两天演进成这样的,也不是一开始就设计并开发成这样的,对于初创公司而言,很难在初期就预估到将来流量千倍、万倍的网站架构会是怎样的情况,同时若是初期就设计成千万级并发的流量架构,也很难去支撑这个成本。面试
所以一个大型服务系统,都是从小一步一步走过来的,在每一个阶段找到对应该阶段网站架构所面临的问题,而后不断解决这些问题,在这个过程当中,整个架构会一直演进,同时内含的代码也就会演进,大到架构、小到代码都是在不断演进和优化的。因此说高大上的项目技术架构和开发设计实现不是一蹴而就的,这是所谓的万丈高楼平地起。redis
从一个小网站提及,通常来讲初始一台服务器就够了,文件服务器、数据库以及应用都部署在一台机器上。也就是俗称的 allinone
架构。算法
随着网站用户逐渐增多,访问量愈来愈大,硬盘、cpu、内存等开始吃紧,一台服务器难以支撑。看一下演进过程,咱们将数据服务和应用服务进行分离,给应用服务器配置更好的 cpu、内存等等,而给数据服务器配置更好、更快的大的硬盘,如图所示用了三台服务器进行部署,能提升必定的性能和可用性。sql
随着访问的并发愈来愈高,为了下降接口的访问时间提升服务性能,继续对架构进行演进。数据库
咱们发现有不少业务数据不须要每次都从数据库中获取,因而咱们使用了缓存,由于 80% 的业务访问都集中在 20% 的数据上 (二八原则),若是能将这部分数据缓存下来,性能就能提升不少,缓存又分两种,一种是 Application 中的本地缓存,还有远程缓存,远程缓存又分为远程的单机式缓存和分布式缓存 (图所示的是分布式缓存集群)。后端
咱们须要思考几点,具备哪一种业务特色的数据使用缓存,具备哪一种业务特色的数据使用本地缓存,具备哪一种业务特色的数据使用远程缓存。分布式缓存在扩容时会赶上什么问题,如何解决,分布式缓存的算法都有哪几种,都有什么优缺点。这些问题都是咱们在使用这个架构时须要思考并解决的问题。浏览器
关注微信公众号:Java技术栈,在后台回复:架构,能够获取我整理的 N 篇最新架构干货。缓存
这个时候随着访问的 qps 不断提升,假设咱们使用的 Application Server 是 tomcat,那么 tomcat 服务器的处理能力就会成为一个瓶颈,虽然咱们也能够经过购买更强大的硬件但总会有上限,而且这个成本到后期是呈指数级的增加。
这时候就能够对服务器作一个集群 (cluster)
,而后添加负载均衡调度器 (LoadBalancer)
,服务器集群后咱们就能够横向扩展咱们的服务器了,解决了服务器处理能力的瓶颈。
此时咱们又须要思考几个问题, 负载均衡的调度策略都有哪些,各有什么优缺点,各适合什么场景,好比轮询、权重、地址散列,地址散列又分为原 IP 地址散列、目标 IP 地址散列、最小链接、加权最小链接等等。
服务器集群后,假设咱们登录了 A 服务器,session 信息存放在 A 服务器上了,若是咱们的负载均衡策略是轮询或者最小链接等,下次是有可能访问到 B 服务器,这时候存储在 A 服务器上的 session 信息咱们在 B 服务器是读取不到的,因此咱们须要解决 session 管理的问题。
咱们使用 session sticky
这种方式来解决这个问题,它的处理规则是对于同一个链接中的数据包,负载均衡会将其进行 NAT 转换后,转发至后端固定的服务器进行处理,这种方案解决了 session 共享的问题。
如图所示客户端 1 经过负载均衡会固定转发到服务器 1 中。缺点是第一假设有一台服务器重启了,那么该服务器的 session 将所有消失,第二是咱们的负载均衡服务器成了一种有状态的服务器,要实现容灾会有麻烦。
session 复制,即当 browser1 通过负载均衡服务器把 session 存到 application1 中,会同时把 session 复制到 application2 中,因此多台服务器都保存着相同的 session 信息。
缺点是应用服务器的带宽问题,服务器之间要不断同步 session 信息,当大量用户在线时,服务器占用内存会过多,不适合大规则集群,适合机器很少状况。
基于 cookie,也就是说咱们每次都用携带 session 信息的 cookie 去访问应用服务器。缺点是 cookie 的长度是有限制的,cookie 保存在浏览器上安全性也是一个问题。
把 session 作成了一个 session 服务器,好比可使用 redis 实现。这样每一个用户访问到应用服务器,其 session 信息最终都存到 session server 中,应用服务器也是从 session server 中去获取 session。
要考虑如下几个问题,在当前架构中 session server 是一个单点的,如何解决单点,保证它的可用性,固然也能够将 session server 作成一个集群,这种方式适用于 session 数量及 web 服务器数量大的状况,同时改为这种架构后,在写应用时,也要调整存储 session 的业务逻辑。
在解决了服务器横向扩展以后,继续看数据库,数据库的读与写操做都须要通过数据库,当用户量达到必定量时,数据库性能又成为了一个瓶颈,咱们继续演进。
咱们可使用数据库的读写分离,同时应用要接入多数据源。经过统一的数据访问模型进行访问。数据库的读写分离是将全部的写操做引入到主库中 (master)
,将读操做引入到从库中 (slave)
,此时应用程序也要作出相应的变化,咱们实现了一个数据访问模块 (data accessmodule)
,使上层写代码的人不知道读写分离的存在,这样多数据源的读写对业务代码就没有侵入,这就是代码层面的演变。
如何支持多数据源,如何封装对业务没有侵入,如何使用目前业务使用的 ORM 框架完成主从的读写分离,是否须要更换 ORM,各有什么优缺点,如何取舍都是当前这个架构须要考虑的问题。
当访问量过大时候,也就是说数据库的 IO 很是大,咱们的数据库读写分离又会遇到如下问题?
例如主库和从库复制有没有延迟,若是咱们将主库和从库分机房部署的话,跨机房传输同步数据更是一个问题。另外应用对数据源的路由问题,这些也是须要思考和解决的点。
咱们继续增长了 CDN
和反向代理服务器 (Reverseproxy server)
,使用 CDN
能够很好的解决不一样地区访问速度问题,反向代理则在服务器机房中能够缓存用户的资源。
这个时候咱们的文件服务器又出现了瓶颈,咱们将文件服务器改为了分布式文件服务器集群,在使用分布式文件系统时,须要考虑几个问题,如何不影响部署在线上的应用访问,是否须要业务部门帮忙清洗数据,是否须要备份服务器,是否须要从新作域名解析等等。
这个时候咱们的数据库又出现了瓶颈,咱们选择专库专用的形式,进行数据的垂直拆分,相关的业务独用本身的一个库,咱们解决了写数据并发量大的问题。
当咱们把这些表分红不一样的库,又会带来一些新的问题。例如跨业务和跨库的事务,可使用分布式事务,或者去掉事务,或者不追求强事务。
随着访问量过大,数据量过大,某个业务的数据库数据量和更新量已经达到了单个数据库的瓶颈了,这个时候就须要进行数据库的水平拆分,例如把 user 拆分红了 user1 和 user2,就是将同一个表的数据拆分到两个数据库当中,这个时候咱们解决了单数据库的瓶颈。
水平拆分时候又要注意哪些点,都有哪几种水平拆分的方式。进行了水平拆分后,又会遇到几个问题,第一 sql 路由的问题,假设有一个用户,咱们如何知道这个用户信息是存在了 user1 仍是 user2 数据库中,因为分库了,咱们的主键策略也会有所不一样,同时会面临分页的问题,假设咱们要查询某月份已经下单的用户明细,而这些用户又分布在 user1 和 user2 库中,咱们后台运营管理系统对它进行展现的时候还要进行分页。这些都是咱们在使用这个架构时须要解决的问题。
在网站发布并进行了大规模的推广后,致使咱们应用服务器的搜索量又飙升,咱们把应用服务器的搜索功能单独抽取出来作了一个搜索引擎,同时部分场景可使用 NoSQL
来提升性能。同时咱们开发一个数据统一的访问模块,同时连着数据库集群、搜索引擎和 NoSQL
,解决上层应用开发的数据源问题。
关注微信公众号:Java技术栈,在后台回复:架构,能够获取我整理的 N 篇最新架构干货。
这里只是简单举例,并无依据什么实际的业务场景。事实上各个服务的架构是要根据实际的业务特色进行优化和演进的,因此这个过程也不是彻底相同的。固然这个架构也不是最终形态,还存在不少要提高的地方。
例如负载均衡服务器目前是一个单点的,若是负载均衡服务器访问不了,那么后续的包括服务器集群等也就没法访问了。因此能够将负载均衡服务器作成集群,而后作一些主从的双机热备,同时作一个自动切换的解决方案。
在整个架构的演进过程当中,其实还包含更多须要关注的内容,好比安全性、数据分析、监控、反做弊......
针对一些特定的场景例如交易、充值、流计算等使用消息队列、任务调度......
整个架构继续发展下去,作成 SOA 架构、服务化 (微服务)、多机房......
最后,我想说高大上的项目技术架构和开发设计实现毫不是一僦而就的。
推荐去个人博客阅读更多:
2.Spring MVC、Spring Boot、Spring Cloud 系列教程
3.Maven、Git、Eclipse、Intellij IDEA 系列工具教程
生活很美好,明天见~