大型网站核心架构要素

  关于什么是架构,一种比较通俗的说法是“最高层次的规划,难以改变的决定”,这些规划和决定奠基了事物将来发展的方向和最终的蓝图。mysql

具体到软件架构,维基百科是这样定义的:“有关软件总体结构与组件的抽象描述,用于指导大型软件系统各个方面的设计”。通常来讲,除了系统的功能需求外,软件架构还须要关注 性能可用性伸缩性扩展性安全性这5个架构要素。算法

1. 性能

性能是网站的一个重要指标,除非是没得选择,不然用户没法忍受一个响应缓慢的网站。一个打开缓慢的网站会致使严重的用户流失,不少时候网站性能是网站架构升级优化的触发器。sql

优化网站性能的手段很是多,从用户浏览器到后台数据库,影响用户请求的全部环节均可以进行性能优化。数据库

  • 浏览器端,能够经过浏览器缓存、使用页面压缩、合理布局页面、减小Cookie传输等手段改善性能。
  • 使用 CDN 和 反向代理服务器(前一篇文章中有介绍)
  • 在应用服务器端,使用服务器本地缓存和分布式缓存
  • 异步操做,将用户请求发送至消息队列等待后续任务处理
  • 在高并发状况下,将多台应用服务器组成一个集群共同对外服务,提升总体处理能力,改善性能
  • 代码层面,能够经过使用多线程、改善内存管理等手段优化性能
  • 数据库服务器端,索引、缓存、SQL优化等性能优化手段都已经比较成熟;而NoSQL数据库经过优化数据模型、存储结构、伸缩性等手段在性能方面的优点也日趋明显。
衡量网站性能有一系列指标:响应时间、TPS、系统性能计数器等,经过监控这些指标能够分析系统瓶颈,预测网站容量,并对异常指标进行报警,保障系统可用性。对于网站而言,性能符合预期仅仅是必要条件,由于没法预知网站可能会面临的访问压力,因此必需要考察系统在高并发访问状况下,超出负载设计能力的状况下可能会出现的性能问题。网站须要长时间持续运行,还必须保证系统在持续运行且访问压力不均匀的状况下保持稳定的性能特性。

2. 可用性

大型网站几乎都承诺7x24小时可用,但事实上任何网站都不可能达到彻底的7x24可用,总会有一些故障时间,扣除这些故障时间就是网站的总可用时间,这个时间换算成网站的可用性指标,以此衡量网站的可用性。一些知名的大型网站能够作到99.99%以上的可用性。
大型网站一般会有上万台服务器,天天一定会有一些服务器宕机,所以网站高可用架构设计的前提是必然会出现服务器宕机,而高可用设计的目标就是当服务器宕机的时候,服务或者应用依然可用。
网站高可用的主要手段是冗余,应用部署在多台服务器上同时提供访问,数据存储在多台服务器上互相备份,任何一台服务器宕机都不会影响应用的总体可用,也不会致使数据丢失。
 
对于应用服务器而言,多台服务器用负载均衡设备组成一个集群共同对外提供服务,任何一台服务器宕机,只需把请求切换到其余服务器就可实现应用的高可用,可是一个前提条件是: 应用服务器上不能保存请求的会话信息,不然服务器宕机,会话丢失,即便将用户请求转发到其余服务器上也没法完成业务处理。
 
对于存储服务器,因为其上存储着数据,须要对数据进行实时备份,当服务器宕机时,须要将数据访问转移到可用的服务器上,并进行数据恢复以保证继续有服务器宕机的时候数据依然可用。
 
除了运行环境,网站的高可用还须要软件开发过程的质量保证。经过预发布验证、自动化测试、自动化发布、灰度发布等手段,减小将故障引入线上环境的可能,避免故障范围扩大。
衡量一个系统架构设计是否知足高可用的目标,就是假设系统中任何一台或者多台服务器宕机时,以及出现各类不可预期的问题时,系统总体是否依然可用。
确保无单点故障。

3. 伸缩性

所谓伸缩性,是指经过不断向集群中加入服务器的手段来缓解不断上升的用户并发访问压力和不断增加的数据存储需求。
衡量架构伸缩性的主要标准就是:是否能够用多台服务器构建集群,是否容易向集群中添加新的服务器。加入新的服务器后是否能够提供和原来的服务器无差异的服务。集群中可容纳的总的服务器数量是否有限制。
 
对于应用服务器集群, 只要服务器上不保存数据,全部服务器都是 对等的,经过使用合适的负载均衡设备就能够向集群中不断加入服务器。
 
对于缓存服务器集群,加入新的服务器可能会致使缓存路由失效,进而致使集群中大部分缓存数据都没法访问。虽然缓存的数据能够经过数据库从新加载,可是若是应用已经严重依赖缓存,可能会致使整个网站崩溃。 须要改进缓存路由算法保证缓存数据的可访问性。一致性hash算法。
 
关系型数据库虽然支持数据复制,主从热备等机制,可是很难作到大规模集群的可伸缩性,所以关系型数据库的集群伸缩性方案必须在数据库以外实现,经过路由分区等手段将部署有多个数据库的服务器组成一个集群。
 
至于大部分 NoSQL 数据库产品,因为其先天就是为海量数据而生,所以其对伸缩性的支持一般都很是好,能够作到在较少运维参与的状况下实现集群规模的线性伸缩。

4. 扩展性

不一样于上面几个架构要素,网站的扩展性架构直接关注网站的功能需求。衡量网站架构扩展性好坏的主要标准就是在网站增长新的业务产品时,是否能够实现对现有产品透明无影响,不须要任何改动或者不多改动既有业务功能就能够上限新产品。
网站可扩展架构的主要手段是  事件驱动架构 和  分布式服务
 
事件驱动架构在网站一般利用 消息队列实现,将用户请求和其余业务事件构形成消息发布到消息队列,消息的处理者做为消费者从消息队列中获取消息进行处理。经过这种方式将消息产生和消息处理分离开来,能够透明地增长新的消息生产者任务或者新的消息消费者任务。
 
分布式服务则是 将业务和可复用服务分离开来,经过分布式服务框架调用。新增产品能够经过调用可复用的服务实现自身的业务逻辑,而对现有产品没有任何影响。可复用服务升级变动的时候,也能够经过提供多版本服务对应用实现透明升级,不须要强制应用同步变动。

5.安全性

网站的安全架构就是保护网站不受恶意访问和攻击,保护网站的重要数据不被窃取。
衡量网站安全架构的标准就是针对现存和潜在的各类攻击手段与窃密手段,是否有可靠的应对策略。
相关文章
相关标签/搜索