大型网站技术架构-2. 大型网站架构模式

  1. 分层前端


  分层是企业应用中最多见的一种架构模式,将系统在横向维度上切分为几个部分,每一个部分负责一部分相对比较单一的职责,而后经过上层对下层的依赖和调用组成一个完整的系统。数据库


  在大型网站架构中也采用分层结构,将网站软件系统分为:应用层、服务层、数据层后端


·应用层:负责具体的业务和视图展现,如网站首页及搜索输入和结果展现;浏览器

·服务层:为应用层提供服务支持,如用户管理服务,购物车服务;缓存

·数据层:提供数据存储访问服务,如数据库、缓存、文件、搜索等;安全


  分层架构必须合理规划层次边界和接口,在开发过程当中,严格遵循分层架构的约束,禁止跨层次的调用(应用层直接调用数据层)及逆向调用(数据层调用服务层,或者服务层调用应用层)。三层结构分别部署在不一样的服务器上,使网站拥有更多的计算资源以及愈来愈多的用户访问。在网站的发展过程当中,分层结构对网站支持高并发向分布式方向发展相当重要。所以在网站规模还很小的时候就采用分层结构,这样未来网站作大时才能更好的应对。服务器



2. 分割网络


   网站越大,功能越复杂,服务和数据处理的种类越多,讲这些不一样的功能和服务分割开来,包装成高内聚低耦合的模块单元,一方面有助于软件的开发和维护;另外一方面,便于不一样模块的分布式部署,提升网站的并发处理能力和功能扩展能力。数据结构



3. 分布式多线程


   对于大型网站,分层和分割的一个主要的目的是为了切分后的模块便于分布式部署,即将不一样模块部署在不一样的服务器上,经过远程调用协同工做。分布式意味着可使用更多的计算机完成相同的功能,计算机越多,cpu、内存、存储资源也就越多,可以处理的并发访问和数据量就越大,进而可以为更多的用户提供服务。


  分布式在解决网站高并发问题的同时也带来了其余问题:


1)分布式意味着服务调用必须经过网络,这可能会对性能形成比较严重的影响

2)服务器越多,服务器宕机的几率也就越大,一台服务器宕机形成的服务不可用可能会致使不少应用不可访问,使网站可用性下降

3)数据在分布式的环境中保持数据一致性也很是困难分布式事务也难以保证,这对网站业务的正确性和业务流程可能形成很大的影响;

4)分布式致使网站依赖错综复杂开发管理维护困难


  在网站应用中,经常使用的分布式方案有如下几种:

·分布式应用和服务:将分层和分割后的应用和服务模块分布式部署,能够改善网站性能和并发性、加快开发和发布速度、减小数据库链接资源消耗外,还可使不一样的应用复用共同的服务,便于业务功能扩展;

·分布式静态资源:网站的静态资源如JS、CSS、logo图片等资源独立分布式部署,并采用独立的域名,即动静分离。静态资源分布式部署能够减轻应用服务器的负载压力;经过使用独立域名加快浏览器并发加载的速度。

·分布式数据和存储:对于海量数据,单台计算机无法提供如此大的存储空间,这些数据须要分布式存储。为网站应用而生的各类NoSQL产品几乎都是分布式的。

·分布式计算:目前网站广泛使用Hadoop以及MapReduce分布式计算框架进行计算。

  

  此外,还有能够支持网站线上服务器配置实时更新的分布式配置;分布式环境下实现并发和协调的分布式锁;支持云存储的分布式文件系统等;


4. 集群


  使用分布式虽然已经将分层和分割后的模块独立化部署,可是对于用户访问集中的模块,还须要将独立部署的服务器集群化,即多台服务器部署相同应用构成一个集群,经过负载均衡设备共同对外提供服务


  由于服务器集群有更多服务器提供相同服务,所以能够提供更好的并发性。当有更多用户访问的时候,只须要向集群中加入新的机器便可。由于一个应用由多态服务器提供,当某台服务器发生故障时,负载均衡设备将请求转发到集群中其余服务器上,使服务器故障不影响用户使用。因此在网站应用中,即便是访问量很小的分布式应用和服务,也至少要部署两台服务器构成一个小的集群,目的是提升系统的可用性。


5. 缓存


  大型网站架构设计在不少方面都是用了缓存设计:

·CDN:即内容分发网络,部署在距离终端用户最近的网络服务商,用户的网络请求老是先到达他的网络服务商哪里,在这里缓存网站的一些静态资源,能够就近以最快的速度返回给用户,如视频网站和门户网站会将访问量大的热点内容缓存在CDN。

·反向代理:反向代理属于网站前端架构的一部分,部署在网站的前端,当用户请求到达网站的数据中心时,最早访问到的是反向代理服务器,这里缓存网站的静态资源,无需将请求继续转发给应用服务器就能返回给用户。

·本地缓存:在应用服务器本地缓存着热点数据,应用程序能够在本机内存中直接访问数据,而无需访问数据库。

·分布式缓存:大型网站的数据量很是庞大,即便只缓存一小部分,须要的内存空间也不是单机能承受的,因此除了本地缓存,还须要分布式缓存,将数据缓存在一个专门的分布式缓存集群中,应用程序经过网络通讯访问缓存数据



  使用缓存有两个前提条件,一是数据访问热点不均衡,某些数据会被更频繁的访问,这些数据应该放在缓存中;二是数据在某个时间段内有效,不会很快过时,不然缓存的数据就会因已经失效而产生脏读,影响结果的正确性。网站应用中,缓存除了能够加快数据访问速度,还能够减轻后端应用和数据存储的负载压力,这一点对网站数据库架构相当重要,网站数据库几乎都是按照有缓存的前提进行负载能力设计的。



6. 异步


  在大型网站架构中,系统解耦合的手段除了前面提到的分层、分割、分布等,还有一个重要的手段是异步,业务之间的消息传递不是同步调用,而是将一个业务操做分红多个阶段,每一个阶段之间经过共享数据的方式异步执行进行协做


  在单一服务器内部可经过多线程共享内存队列的方式实现异步,处在业务操做前面的线程将输出写入到队列,后面的线程从队列中读取数据进行处理;

  在分布式系统中,多个服务器集群经过分布式消息队列实现异步,分布式消息队列能够看作内存队列的分布式部署。


  异步架构是典型的生产者消费者模式,二者不存在直接调用,只要保持数据结构不变,彼此功能实现能够随意变化而不相互影响,这对网站扩展新功能很是便利。除此以外,使用异步消息队列还有以下特性:

·提升系统的可用性:消费者服务器发生故障,数据会在消息队列服务器中存储堆积,生产者服务器能够继续处理业务请求,系统总体表现无端障。消费者服务器恢复正常后,继续处理消息队列中的数据。

·加快网站响应速度:处在业务处理前端的生产者服务器在处理完业务请求后,将数据写入消息队列,不须要等待消费者服务器处理就能够返回,响应延迟减小。

·消除并发访问高峰:使用消息队列将忽然增长的访问请求数据放到消息队列中,等待消费者服务器依次处理,就不会对整个网站负载形成太大的压力。

  

  但须要注意的是,使用异步方式处理业务可能会对用户体验、业务流程形成影响,须要网站产品设计方面的支持。



7. 冗余


  网站须要7x24小时连续运行,可是服务器随时可能出现故障,特别是服务器规模比较大时,出现某台服务器宕机是必然事件。想要保证在服务器宕机的状况下网站依然能够继续服务,不丢失数据,就须要必定程度的服务器冗余运行,数据冗余备份,这样当某台服务器宕机时,能够将其上的服务和数据访问转移到其余机器上。


  访问和负载很小的服务也必须部署至少两台服务器构成一个集群,其目的就是经过冗余实现服务高可用。数据库除了按期备份,存档保存,实现冷备份外,为了保证在线业务高可用,还须要对数据库进行主从分离,实时同步实现热备份。


8. 自动化



9. 安全


----新浪微博平台架构

http://blog.jobbole.com/83459/

相关文章
相关标签/搜索