模式:关键在于模式的可重复性,问题与场景的可重复性带来解决方案的可重复使用。html
大型互联网公司在实践中提出了许多解决方案,以实现网站高性能、高可用、易伸缩、可扩展、安全等各类技术架构目标。sql
这些解决方案又被更多网站重复使用,从而逐渐造成大型网站架构模式。数据库
1.分层浏览器
分层是企业应用系统中最多见的一种架构模式,将系统在横向维度上切分红几个部分,每一个部分负责一部分相对比较单一的职责,而后经过上层对下层的依赖和调用组成一个完整的系统。缓存
在大型网站架构中也采用分层结构,将网站软件系统分为应用层、服务层、数据层:安全
分层架构也有一些挑战,就是必须合理规划层次边界和接口,在开发过程当中,严格遵循分层架构的约束,禁止跨层次的调用(应用层直接调用数据层)及逆向调用(数据层调用服务层,或者服务层调用应用层)。服务器
大的分层结构内部还能够继续分层,如应用层还能够分为业务逻辑层和视图层,服务层还能够分红逻辑处理层和数据接口层。网络
分层架构是逻辑上的,在物理部署上,三层架构能够部署在同一个物理机器上,可是随着网站业务的发展,必然须要对已经分层的模块分离部署,即三层结构分别部署在不一样的服务器上,使网站拥有更多的计算资源以应对愈来愈多的用户访问。数据结构
因此虽然分层架构模式最初的目的是规划软件清晰的逻辑结构以便于开发维护,但在网站的发展过程当中,分层结构对网站支持高并发向分布式方向的发展相当重要。所以在网站规模还很小的时候就应该采用分层的架构,这样未来网站作大时才能更好应对。多线程
2.分割
若是说分层是将软件在横向方面进行切分,那么分割就是在纵向方面对软件进行切分。
网站越大,功能越复杂,服务和数据处理的种类也越多,将这些不一样的功能和服务分隔开来,包装成高内聚低耦合的模块单元,不只有助于软件的开发维护也便于不一样模块的分布式部署,提升网站的并发处理能力和功能扩展能力。
大型网站分割的粒度可能会很小。好比在应用层,将不一样业务进行分割,例如将购物、论坛、搜索、广告分割成不一样的应用,有独立的团队负责,部署在不一样的服务器上。
若是业务复杂庞大,在同一个应用内部还能够继续分割,好比购物业务能够分割成机票酒店业务,小商品业务等,这些又能够继续分割成首页,搜索列表等。
3.分布式
对于大型网站,分层和分割的一个主要目的是为了切分后的模块便于分布式部署,即将不一样模块部署在不一样的服务器上,经过远程调用协同工做。
分布式意味着可使用更多的计算机完一样的工做,计算机越多,CPU、内存、存储资源就越多,能过处理的并发访问和数据量就越大,进而可以为更多的用户提供服务。
分布式存在的问题:
1. 分布式意味着服务调用必须经过网络,可能会对性能形成比较严重影响
2. 服务器越多,宕机几率越大,一台服务器宕机可能会致使不少应用不可访问,下降可用性
3. 数据一致性难以保障,分布式事务
4. 网站依赖综合复杂,开发管理维护困难
经常使用的分布式方案有如下几种:
分布式应用和服务:将分层和分割后的应用和服务模块分布式部署,能够改善网站性能和并发性、加快开发和发布速度、减小数据库链接资源消耗。
分布式静态资源:网站的静态资源如JS、CSS、Logo图片等资源独立分布式部署,并采用独立的域名,即人们常说的动静分离。静态资源分布式部署能够减轻应用服务器的负载压力;经过使用独立域名加快浏览器并发加载的速度。
分布式数据和存储:大型网站须要处理以P为单位的海量数据,单台计算机没法提供如此大的存储空间,这些数据库须要分布式存储。除了对关系数据库分布式部署外,nosql也几乎都是分布式的。
分布式计算:目前网站广泛使用Hadoop和MapReduce分布式计算框架进行此类批处理计算,其特色是移动计算而不是移动数据,将计算程序分发到数据所在的位置以加速计算和分布式计算。
此外,还有支持网站线上服务器配置实时更新的分布式配置;分布式环境下实现并发和协同的分布式锁;支持云存储的分布式文件系统等
4.集群
对于用户访问集中的模块须要将独立部署的服务器集群化,即多台服务器部署相同的应用构成一个集群,经过负载均衡设备共同对外提供服务。
服务器集群可以为相同的服务提供更多的并发支持,当有更多的用户访问时,只须要向集群中加入新的机器便可;
当其中的某台服务器发生故障时,负载均衡的失效转移机制将请求转移至集群中其余服务器上,所以提升系统的可用性。
【即便是访问量很小的分布式应用和服务,也至少要部署两台服务器构成一个小集群,就是为了提升可用性】
5.缓存
缓存就是将数据存放在距离计算最近的位置以加快处理速度。
缓存是改善软件性能的第一手段,软件设计中缓存无处不在。
网站架构中的缓存有如下几种:
缓存的两个前提条件:
1.数据访问热点不均衡,被频繁访问的数据更该放在缓存中;
2.数据不会很快过时,不然易由于缓存数据失效致使脏读
6.异步
软件发展的一个重要目标和驱动力是下降软件耦合性。解耦合的手段除了分层,分割,分布等,还有一个重要手段是异步,将一个业务操做分红多个阶段,每一个阶段经过共享数据的方式异步执行进行协做
在单一服务器内部可经过多线程共享内存对了的方式处理;在分布式系统中可经过分布式消息队列来实现异步。
异步架构的典型就是生产者消费者方式,二者不存在直接调用。只要保持数据结构不变,彼此功能实现能够随意变化而不互相影响,扩展新功能很是便利。
异步还有以下特性:
异步处理业务可能影响用户体验,须要产品设计的支持。
7.冗余
服务器规模比较大时,宕机几乎是必然事件。要保证在服务器宕机的状况下网站依然能够继续服务,不丢失数据,就须要一点程度的服务器冗余运行,数据冗余备份。当某台服务器宕机时,能够将其上的服务和数据访问转移到其余机器上
访问和负载很小的服务也必须部署至少两台服务器构成集群,目的就是经过冗余实现高可用。数据库除了冷备份外,为了保证在线业务高可用,还须要对数据库进行主从分离,实时同步实现热备份,某些大网站还会部署灾备数据中心
8.自动化
无人值守的状况下网站能够正常运行,一切均可以自动化是网站的理想状态。目前大型网站的自动化架构设计主要集中在发布运维方面,包括如下:
9.安全
网站在安全架构方面的一些模式: