网站架构优化性能

最开始的网站架构

        最初业务量不大,访问量小,此时的架构,应用程序、数据库、文件都部署在一台服务器上,有些甚至仅仅是租用主机空间redis

1. 应用、数据、文件分离

        将应用程序、数据库、文件各自部署在独立的服务器上,而且根据服务器的用途配置不一样的硬件,达到最佳的性能效果。sql

2. 利用缓存改善网站性能

        大部分网站访问都遵循28原则,即80%的访问请求,最终落在20%的数据上,因此咱们能够对热点数据进行缓存,减小热点数据的访问路径,提升用户体验。缓存实现常见的方式是本地缓存、分布式缓存。固然还有CDN、反向代理。mongodb

2.1 本地缓存        本地缓存,顾名思义是将数据缓存在应用服务器本地,能够存在内存中,也能够存在文件,组件。本地缓存的特色是速度快,但由于本地空间有限因此缓存数据量也有限。OSCache就是经常使用的本地缓存。数据库

2.2 分布式缓存        分布式缓存的特色是,能够缓存海量的数据,而且扩展很是容易,在门户类网站中经常被使用,速度按理没有本地缓存快,经常使用的分布式缓存是Memcached、Redis。缓存

 

2.3 反向代理        部署在网站的机房,当用户请求达到时首先访问反向代理服务器,反向代理服务器将缓存的数据返回给用户,若是没有缓存数据才会继续访问应用服务器获取,这样作减小了获取数据的成本。反向代理有Squid,Nginx。安全

2.4 CDN        假设咱们的服务器都部署在杭州的机房,对于浙江的用户来讲访问是较快的,而对于北京的用户访问是较慢的,这是因为浙江和北京分别属于电信和联通的不一样发达地区,北京用户访问须要经过互联路由器通过较长的路径才能访问到杭州的服务器,返回路径也同样,因此数据传输时间比较长。对于这种状况,经常使用CDN解决,CDN将数据内容缓存到运营商的机房,用户访问时先从最近的运营商获取数据,这样大大减小了网络访问的路径。比较专业的CDN运营商有蓝汛、网宿。服务器

3. 使用集群+负载均衡改善应用服务器性能

        应用服务器做为网站的入口,会承担大量的请求,咱们每每经过应用服务器集群来分担请求数。        应用服务器前面部署负载均衡服务器调度用户请求,根据分发策略将请求分发到多个应用服务器节点。网络

        经常使用的负载均衡技术硬件的有F5,价格比较贵通常都在15W以上。        软件的有LVS、Nginx、HAProxy。LVS是四层(传输层)负载均衡,根据目标地址和端口选择内部服务器,Nginx和HAProxy是七层(应用层)负载均衡,能够根据报文内容选择内部服务器,所以LVS分发路径优于Nginx 和HAProxy,性能要高些,而Nginx和HAProxy则更具配置性,如能够用来作动静分离(根据请求报文特征,选择静态资源服务器仍是应用服务器)。架构


4. 数据库优化

4.1 读写分离和分库分表        随着用户量的增长,数据库成为最大的瓶颈,改善数据库性能经常使用的手段是进行读写分离以及分库分表,读写分离顾名思义就是将数据库分为读库和写库,经过主备功能实现数据同步。分库分表则分为水平切分和垂直切分,水平切分则是对一个数据库特大的表进行拆分,例如用户表。垂直切分则是根据业务的不一样来切分,如用户业务、商品业务相关的表放在不一样的数据库中。并发

4.2 使用NoSql数据库和搜索引擎        对于海量数据的查询和分析,咱们使用nosql数据库加上搜索引擎能够达到更好的性能。并非全部的数据都要放在关系型数据中。经常使用的NOSQL有mongodb、hbase、redis,搜索引擎有lucene、solr、elasticsearch。


5. 将应用服务器进行业务拆分

        随着业务的扩展,应用程序变得很是臃肿,这时咱们须要将应用程序进行业务拆分,如百度分为新闻、网页、图片等业务。每一个业务应用负责相对独立的业务运做。业务之间经过消息进行通讯或者共享数据库来实现。

6.使用分布式系统

6.1 分布式文件系统        用户一每天增长,业务量愈来愈大,产生的文件愈来愈多,单台的文件服务器已经不能知足需求,这时就须要分布式文件系统的支撑。经常使用的分布式文件系统有GFS、HDFS、TFS。

GFS(Google File System)能够给大量的用户提供整体性能较高的服务
• 适合部署在廉价的普通硬件上
• 提供容错功能

HDFS(Hadoop Distributed File System)能提供高吞吐量的数据访问,很是适合大规模数据集上的应用
• 运行在通用硬件(commodityhardware)
• 高度容错
• 适合部署在廉价的机器上

TFS(Taobao Flies System)主要针对海量的非结构化数据,提供高可靠和高并发的存储访问
• 高可扩展、高可用、高性能
• 面向互联网服务
• 适合海量小文件存储

6.2 分布式服务        各个业务应用都会使用到一些基本的业务服务,例如用户服务、订单服务、支付服务、安全服务,这些服务是支撑各业务应用的基本要素。咱们将这些服务抽取出来利用分部式服务框架搭建分布式服务。阿里的Dubbo是一个不错的选择。

小结

        完整的系统架构图以下:

         注:大型网站的架构是根据业务需求不断完善的,根据不一样的业务特征会作特定的设计和考虑,本文只是讲述一个常规大型网站会涉及的一些优化技术和手段。

相关文章
相关标签/搜索