性能测试是性能优化的前提和基础。也是性能优化检查和度量的标准。不一样的视角下网站的性能有不一样的标准,也有不一样的优化手段css
过程:用户状况à网站通信时间à处理时间à用户计算机浏览器解析 html
优化手段
经过前端优化手段,经过html样式话,利用浏览器段并发和异步特性,挑战浏览器缓存,使用CDN和反向代理使浏览器尽快返回用户感兴趣数据。即便不优化应用程序和架构,也能够很大程度改善用户视觉性能 前端
关注应用程序自己及子系统的性能,包括相应延迟,系统吞吐量,并发处理能力,系统稳定行等技术指标。 算法
优化手段: 数据库
使用缓存加速数据读取,使用集群提升吞吐能力,使用异步消息加快请求响应及实现削峰,使用代码优化改善程序性能。 浏览器
运维人员更关注基础设施性能和资源利用率,如带宽处理能力, 缓存
优化手段: 安全
服务器硬件配置,数据中心网络架构,服务器和网络带宽利用率等主要优化手段建设,使用高性价比定制服务器,利用虚拟化技术优化资源利用。 性能优化
3、架构设计中要考虑的核心五要素
性能、可用性、扩展性、伸缩性、安全性 服务器
(1)性能测试指标:①响应时间;②并发数;③吞吐量;④性能计数器;
(2)性能测试方法:①性能测试;②负载测试;③压力测试;④稳定性测试;
(3)性能优化策略:
①性能分析:排查一个网站的性能瓶颈和排查一个应用查询的性能手法基本相同:检查请求处里的各个环节日志,分析那个环节响应时间不合理,超过预期;而后检查监控数据,分析影响性能的主要因素是内存,磁盘,网络仍是cpu,是代码问题仍是架构不合理,或是系统资源不足
②性能优化:Web前端优化,应用服务器优化,存储服务器优化;
性能优化前的准备
响应时间
应用执行一个操做须要的时间,包括从发出请求开始到收到最后响应数据所须要的时间。响应时间是系统最重要的性能指标,直观地反映了系统的"快慢"。下表列出了一些经常使用的系统操做须要的响应时间。
并发数
系统可以同时处理请求的数目
吞吐量
单位时间内系统处理的请求数量; 如:TPS、QPS(每秒查询数),HPS每秒http请求数量 ,PV 页面访问,随着并发数的增大,吞吐量随着增大; 超过阈值后,并发数继续增大,吞吐量降低,直到吞吐量降为0,网站宕机;理解上述3个指标:类比高速公路行车 ,吞吐量就是天天经过的车辆数 ,并发数是正在行驶的车辆 ,响应时间是车速
性能计数器
描述服务器或操做系统性能指标的一些数据指标。包括System Load,对象与线程数,内存使用,cpu使用,磁盘与网络io等指标.这些指标也是性能监控的重要指标。System Load反映系统Cpu正在指向和等待执行的进程数量。
下图中的横坐标表示消耗的系统资源,纵坐标表示系统处理能力(吞吐量)。在开始阶段,随着并发请求数目的增长,系统使用较少的资源就达到较好的处理能力(a~b段),这一段是网站的平常运行区间,网站的绝大部分访问负载压力都集中在这一段区间,被称做性能测试,测试目标是评估系统性能是否符合需求及设计目标;随着压力的持续增长,系统处理能力增长变缓,直到达到一个最大值(c点),这是系统的最大负载点,这一段被称做负载测试。测试目标是评估当系统由于突发事件超出平常访问压力的状况下,保证系统正常运行状况下可以承受的最大访问负载压力;超过这个点后,再增长压力,系统的处理能力反而降低,而资源消耗却更多,直到资源消耗达到极限(d点),这个点能够看做是系统的崩溃点,超过这个点继续加大并发请求数目,系统不能再处理任何请求,这一段被称做压力测试,测试目标是评估可能致使系统崩溃的最大访问负载压力。
性能测试反应的是系统在实际生产环境中使用时,随着用户并发访问数量的增长,系统的处理能力。与性能曲线相对应的是用户访问的等待时间(系统响应时间),如图所示。
在平常运行区间,能够得到最好的用户响应时间,随着并发用户数的增长,响应延迟愈来愈大,直到系统崩溃,用户失去响应。
测试结果报告应可以反映上述性能测试曲线的规律,阅读者能够获得系统性能是否知足设计目标和业务要求、系统最大负载能力、系统最大压力承受能力等重要信息,下表是一个简单示例。
(1)浏览器访问优化:
①减小http请求:由于http是无状态的,每次请求的开销都比较昂贵(须要创建通讯链路、进行数据传输,而服务器端对于每一个http请求都须要启动独立的线程去处理);减小http的主要手段是合并CSS、合并JS、合并图片(CSS精灵,利用偏移定位image);
②使用浏览器缓存:设置http头中Cache-Control和Expires属性;
③启用压缩:能够对html、css、js文件启用Gzip压缩,能够达到较高的压缩效率,可是压缩会对服务器及浏览器产生必定的压力;
④CSS放页面最上面,JS放页面最下面:浏览器会在下载彻底部CSS以后才开始对整个页面进行渲染,所以最好将CSS放在页面最上面;而浏览器在加载JS后会当即执行,有可能会阻塞整个页面,形成页面显示缓慢,所以最好将JS放在页面最下面;
⑤减小Cookie传输:一方面,太大的Cookie会严重影响数据传输;另外一方面,对于某些静态资源的访问(如CSS、JS等)发送Cookie没有意义;
(2)CDN加速:
CDN(内容分发网络)仍然是一个缓存,它将数据缓存在离用户最近的地方,便于用户以最快速度获取数据。即所谓的"网络访问第一跳",以下图所示:
CDN只将访问频度很高的热点内容(例如:图片、视频、CSS、JS脚本等访问频度很高的内容)进行缓存,能够极大地加快用户访问速度,减小数据中心负载。
(3)反向代理:
反向代理服务器位于网站机房,代理网站Web服务器接收Http请求,对请求进行转发,以下图所示:
反向代理服务器具备如下功能:
①保护网站安全:任何来自Internet的请求都必须先通过代理服务器;
②经过配置缓存功能加速Web请求:减轻真实Web服务器的负载压力;
③实现负载均衡:均衡地分发请求,平衡集群中各个服务器的负载压力;
(1)分布式缓存:
PS:网站性能优化第必定律:优先考虑使用缓存优化性能。缓存是指将数据存储在相对较高访问速度的存储介质中(如内存),以供系统进行快速处理响应用户请求。
①缓存本质是一个内存Hash表,数据以(Key,Value)形式存储在内存中。
②缓存主要用来存放那些读写比很高、不多变化的数据,如商品的类目信息、热门商品信息等。这样,应用程序读取数据时,先到缓存中取,如缓存中没有或失效,再到数据库中取出,从新写入缓存以供下一次访问。所以,能够很好地改善系统性能,提升数据读取速度,下降存储访问压力。
③分布式缓存架构:一方面是以以JBoss Cache为表明的互相通讯派;另外一方面是以Memcached为表明的互不通讯派;
JBoss Cache须要将缓存信息同步到集群中的全部机器,代价比较大;而Memcached采用一种集中式的缓存集群管理,缓存与应用分离部署,应用程序经过一致性Hash算法选择缓存服务器远程访问缓存数据,缓存服务器之间互不通讯,于是集群规模能够轻易地扩容,具备良好的伸缩性。
Memcached由两个核心组件组成:服务端(ms)和客户端(mc),在一个memcached的查询中,mc先经过计算key的hash值来肯定kv对所处在的ms位置。当ms肯定后,客户端就会发送一个查询请求给对应的ms,让它来查找确切的数据。由于这之间没有交互以及多播协议,因此 memcached交互带给网络的影响是最小化的。
(2)异步操做:
①使用消息队列将调用异步化,可改善网站的扩展性,还可改善网站性能;
②消息队列具备削峰的做用->将短期高并发产生的事务消息存储在消息队列中,从而削平高峰期的并发事务;
PS:任何能够晚点作的事情都应该晚点再作。前提是:这个事儿确实能够晚点再作。
(3)使用集群:
①在高并发场景下,使用负载均衡技术为一个应用构建多台服务器组成的服务器集群;
②能够避免单一服务器因负载压力过大而响应缓慢,使用户请求具备更好的响应延迟特性;
③负载均衡能够采用硬件设备,也能够采用软件负载。商用硬件负载设备(例如出名的F5)成本一般较高(一台几十万上百万很正常),因此在条件容许的状况下咱们会采用软负载,软负载解决的两个核心问题是:选谁、转发,其中最著名的是LVS(Linux Virtual Server)。
PS:LVS是四层负载均衡,也就是说创建在OSI模型的第四层——传输层之上,传输层上有咱们熟悉的TCP/UDP,LVS支持TCP/UDP的负载均衡。
LVS的转发主要经过修改IP地址(NAT模式,分为源地址修改SNAT和目标地址修改DNAT)、修改目标MAC(DR模式)来实现。有关LVS的详情请参考:http://www.importnew.com/11229.html
(4)代码优化:
①多线程:使用多线程的缘由:一是IO阻塞,二是多CPU,都是为了最大限度地利用CPU资源,提升系统吞吐能力,改善系统性能;
②资源复用:目的是减小开销很大的系统资源的建立和销毁,主要采用两种模式实现:单例(Singleton)和对象池(Object Pool)。例如,在.NET开发中,常用到的线程池,数据库链接池等,本质上都是对象池。
③数据结构:在不一样场合合理使用恰当的数据结构,能够极大优化程序的性能。
Java中JVM介绍及GC执行时机
内存分为堆栈和堆,堆栈用于存储线程上下文信息,如方法参数,局部变量等。堆则是存储对象的内存空间,对象的建立和销毁。垃圾回收就是在这里进行。
将JVM分为年轻带(Young Generation)和年老带(Old Generation),又将年轻带(Young Generation)分为,Eden区,From区,To区。新建对象老是在Eden区建立,当Eden区空间已满,就触发一次Young GC(Garbage Collection,垃圾回收),将还被使用的对象复制到From区,这样Eden区都是未使用的对象,还能够继续建立对象,当Eden去在次用完,在触发一次Young GC,将Eden区和From区还在使用的对象复制到To区。下一次Young GC则是将Eden区和To区对象复制到From区。通过屡次GC,某些对象会在From和To区屡次复制,若是超过某个阀值对象还未被释放,则将对象复制到Old Generation。若是Old Generation空间已经用完,那么会触发Full GC,即所谓的全量回收,全量回收对系统性能产生较大影响,所以应该根据业务特色和对象生命周期合理设置Young Generation和Old Generation区域大小,尽可能减小Full GC.
(1)机械硬盘仍是固态硬盘?
①机械硬盘:经过马达驱动磁头臂,带动磁头到指定的磁盘位置访问数据。它可以实现快速顺序读写,慢速随机读写。
②固态硬盘(又称SSD):无机械装置,数据存储在可持久记忆的硅晶体上,所以能够像内存同样快速随机访问。
在目前的网站应用中,大部分应用访问数据都是随机的,这种状况下SSD具备更好的性能表现,可是性价比有待提高(蛮贵的,么么嗒)。
(2)B+树 vs LSM树
①传统关系型数据库普遍采用B+树,B+树是对数据排好序后再存储,加快数据检索速度。
PS:目前大多数DB多采用两级索引的B+树,树的层次最多三层。所以可能须要5次磁盘访问才能更新一条记录(三次磁盘访问得到数据索引及行ID,一次数据文件读操做,一次数据文件写操做,终于知道数据库操做有多麻烦多耗时了)
②NoSQL(例如:HBase)产品普遍采用LSM树:
具体思想是:将对数据的修改增量保持在内存中,达到指定的大小限制后将这些修改操做批量写入磁盘。不过读取的时候稍微麻烦,须要合并磁盘中历史数据和内存中最近的修改操做,因此写入性能大大提高,读取时可能须要先看是否命中内存,不然须要访问较多的磁盘文件。
LSM树的原理是:把一棵大树拆分红N棵小树,它首先写入内存中,随着小树愈来愈大,内存中的小树会被清除并写入到磁盘中,磁盘中的树按期能够作合并操做,合并成一棵大树,以优化读性能。
LSM树的优点在于:在LSM树上进行一次数据更新不须要磁盘访问,在内存便可完成,速度远快于B+树。
对于网站的高性能架构这一章的阅读,经过大牛的书籍咱们学到了从三个主要方面的性能优化策略,虽然都是理论,并且还只是浅显地说明,可是对于咱们这些广大的开发菜鸟来讲,扩展知识面,了解一点优化策略不是一件坏事,咱们能够从中注意到平常的代码规范,如何写出高效的代码也是一件值得研究的事儿。在书中,看到了做者写了这样一句话,贴出来与各位正在学习途中的菜鸟们共享:"归根结底,技术是为业务服务的,技术选型和架构决策依赖业务规划乃至企业战略规划,离开业务发展的支撑和驱动,技术走不远,甚至还会迷路"。出来实习了一年多,对这句话感慨颇多,也吃了不少的亏,在和客户的沟通交流上也有了本身的一点感悟,因此贴出来与各位园友共勉。最后,但愿做为菜鸟的咱们,在技术这条路上可以走得远一些,迷路不重要,重要的是可以迷途知返,么么嗒!再过一个多月,就要开始找工做了,但愿在此期间可以认真阅读完本身的计划书单,加油!
(1)李智慧,《大型网站技术架构-核心原理与案例分析》,http://item.jd.com/11322972.html
(2)周言之,《Memcached详解》,http://blog.csdn.net/zlb824/article/details/7466943
(3)百度百科,CDN,http://baike.baidu.com/view/8689800.htm
(4)王晨纯,《Web基础架构:负载均衡和LVS》,http://www.importnew.com/11229.html
(5)辉之光,《B树、B-树、B+树》,http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html
(6)yanghuahui's blog,《LSM树由来、设计思想以及应用到HBase的索引》,http://www.cnblogs.com/yanghuahui/p/3483754.html
部份内容转载自http://www.cnblogs.com/edisonchou/博客