网站用户访问速度监测分析项目javascript
刚来新公司不久作运维开发,本为觉得要继续作个人开源软件开发,结果领导给分了个之前基本历来没考虑的任务,监测用户访问咱们网站的速度,没错,是监测全部的用户访问咱们网站的速度。就跟基调同样。由于基调不能实现咱们一些特殊的定制需求,因此公司准备咱们本身开发一个。虽然之前没作过,可是有挑战才有意思嘛,开始走起。php
首先,肯定页面速度如何监控?监控什么指标?如何分析?领导的基本需求以下:html
实现全国各地用户访问速度的按区域分析前端
实现用户从浏览器开始请求到页面加载完毕的每一步骤的指标统计java
实现对定点区域的任务下发web
到底咋作?刚开始想的是,可否经过分析网站日志来实现呢?尼马,固然不可能这么简单,由于日志里最多只能记录服务器收到请求到开始响应的时间,用户什么时候彻底加载完你的页面,是找不到的。那咋办?先学习基调的监测方法发现,他们是在全国各个机房里埋了数万个客户端,让这些客户端定时自动访问你的网站,而后再对每一个客户端的加载速度作汇总后分析。很显然咱们不可能在全国各个机房放一台机器当客户端,那样的花费非得把公司卖了不行。本着花小钱办大事的思想,灵光一现,为何不让用户直接帮咱们测?咱们网站天天数亿PV,这么好的资源不用就白浪费了。咋让用户帮咱们测?呵呵,很简单,在页面埋码,在用户访问咱们页面的时候,浏览器会自动运行一段JS脚本,会纪录从浏览器开始请求到整个页面加载完毕的过程。而后个人脚本把这些纪录的值作成一个字典,统一用GET的方式发送到后台分析接口,后台分接程序接到数据进来后就按相应的分析维度作分析,而后,而后问题就解决了嘛。redis
GOOD,既然觉得逻辑能走通,那就开始测试下吧,废话少说上干货,如下为实现过程:chrome
前端埋码json
首先肯定收集如下指标跨域
onLoad页面加载时间
页面下载时间
JS加载时间
从request开始到服务器响应时间
DomReady时间
第一次渲染时间(白屏时间)
DNS lookup时间
从服务器下载第一个byte时间
导航类型
请求的url
浏览器类型
浏览器版本
分辨率
以上指标只是第一期功能,之后可能还会加不少新的指标,彻底靠本身写JS来实现挺麻烦的,尼马我是运维开发呀,不是搞前端的呀,这么多东西怎么弄,果断寻找开源解决方案,找来找去找到了yahoo开源的一个页面速度指标收集的小插件boomerang, 下载下来用了下发现很强大,支持自行开发plugin, 因而就在他的基础上作了些更改,本身加入了一些自定义指标的收集。
为了帮助看客了解,先跟你们说一下,以上指标如何收集?一个HTML页面从开始服务器请求,到整个页面展示在用户面前,实际上是通过好多个步骤的,擦,干说好累,仍是上图吧。
如上图,页面整个加载过程通常为:
输入网址回车 navigationStart
DNS解析,获取网站IP地址 domainLookupStart
向服务器IP发起请求,TCP/IP 3次握手,创建链接 ConnectStart
服务器开始处理用户请求页面的URL ResponseStart
向用户发送第一个字节 FristByte
DOM加载完毕 domComplete
Onload事件开始 LoadEventtart
页面加载完毕 LoadEventEnd
亲,知道么,如今基本上全部的主流浏览器都会在页面加载的时候把这些指标记录下来,你能够直接在JS脚本里调用。调用方法等详细指标解释请看 https://dvcs.w3.org/hg/webperf/raw-file/tip/specs/NavigationTiming/Overview.html
由于不支持IE9如下的浏览器,因此,去他妈的IE,果断放弃老版本IE,直接设置为在IE9如下不执行,简单粗暴。
浏览器版本检测代码
<script type="text/javascript">
function get_browser() {
var N = navigator.appName, ua =navigator.userAgent, tem;
var M =ua.match(/(opera|chrome|safari|firefox|msie)\/?\s*(\.?\d+(\.\d+)*)/i);
if (M && (TEM = ua.match(/version\/([\.\d]+)/i)) != null) M[2] =tem[1];
M = M ? [M[1], M[2]] : [N, navigator.appVersion, '-?'];
return M[0];
}
function get_browser_version() {
var N = navigator.appName, ua = navigator.userAgent, tem;
var M = ua.match(/(opera|chrome|safari|firefox|msie)\/?\s*(\.?\d+(\.\d+)*)/i);
if (M && (tem = ua.match(/version\/([\.\d]+)/i)) != null) M[2] =tem[1];
M = M ? [M[1], M[2]] : [N, navigator.appVersion, '-?'];
return M[1];
}
var browser = get_browser();
var browser_version = get_browser_version();
var br_detect = 0; //default to run
if (browser == 'MSIE') {
if (parseInt(browser_version) < 9) {
var br_detect = 1; //not runthe status js
}
} //end if browser
//setJS controller variable for speed monitor plugin
varBoomRunMark = 0; //0 = enable , 1=disable
varBoomKickStartMark = 5; // run the collect plugin when random num < 5
varRandomNumber = Math.floor((Math.random() * 10) + 1);
if(br_detect == 0) {
imgLoadBeginTime= new Date();
}
//console.log('randomnumber :'+ RandomNumber);
if (br_detect == 0) {
if (BoomRunMark == 0){
if(RandomNumber < BoomKickStartMark ){
BOOMR.init({
beacon_url:"http://perf.che168.com/pv_perf.php",
BW:{ enabled: false },
RT:{
cookie:'CHE168-RT'
}
});
}//endRandomNumber check
}// end BoomRunMark check
}//end if br_detect
</script>
作完后,上线测试,打开网站,就看到个人脚本在华丽丽的跑了。
因为天天收集量在大约上千万,而后又须要用户访问速度进行实时分析,因此才用了storm实时日志流分析,对数据作基本处理后,把各个地区的访问统计一下,写入redis,由于量大,实时数据只存1天左右,过了一天,就把这些数据按小时进行平均优化等。
分析方法,
因为数据量大,若是直接简单的对数据作平均的话,确定会出现不少极值,致使平均值不能表明整组数据的实际平均值,例如,两组数,[1,999], [499,501] 两组数平均后都等于500,直接取平均值就太坑了,这时候高中数学终于用上了,直接取标准差,中位数,而后又TP90,TP99了一下,一番下来,数据基本准了,固然其中不少细节实现,有兴趣的同窗能够专门找我探讨。
直接看最后实现吧:
如下为实时监控部分:
好吧,差就多就这些吧,回头搞一下,争取开源下。 打完收工。
项目实战之:网站用户访问质量分析监测分析项目开发
我想讲,当你身处一家上市公司,公司老板又创业明星,你们都认识他,用户一访问不了你的网站就会蛋疼的@你老板,即便是他本身在拉屎时不当心把网线扯掉了,想一想老板的微博每天收到的都是你家网站挂了的消息时那种一脸黑线的感受 吧。他想,我是花钱养了一堆废物么?
而后老板就把这些用户的投诉发给了大家技术老大,技术老大让你检测网站是否不能访问,你先从内部测,再从外面测,最后还发qq让本身在外地的几个前女朋友也帮你测试,都 说网站没问题,因而你告诉技术老大说网站没问题,老大说你怎么测的,你这个用户来自广东,你确认从测试了广州节点没问题么?此时你就蒙逼了,由于你并无一个在广州的女友,惟一进入记忆的也只是2年前在东莞帮你作大保健的姑娘,当时还劝人家从良,如今还依稀想起那姑娘帮你服务完离开时的回眸一笑的样子,此时也不知她已散落在何方。。。,老板打断正走神的你,问你确认广州节点有没有问题。你振做了下说我从北京测试了直接访问广州cdn节点,也是没问题的, 此用户不能上网并不能表明广泛问题,有多是个别isp链路出了问题致使的, 老板又问你,那你怎么不肯定这不是广泛 问题?只因你本身测试了说 没问题,就表明全部广东人都没问题了? 碰上这样的老板, 此时的你是这样的。。。。
老板又故做严肃了一下说,我固然知道广州总体上访问没问题,但问题是咱们要有可视化的数据支持,要有能让人一看便知,总体地区访问大家网站的质量是什么样的,快?慢?仍是挂了?仍是怎样,这些东西要有可视化的数据支持,不能你找了几个朋友测试一下说没问题就算完了,只要在客观的、具备普遍表明性的、可视化的数据的支持下,咱们才能让大老板相信,咱们的网站确实没问题,是否是?
原本刚才还以为老板sb的你,听这此番话,以为, 仍是老板考虑的周全呀。
so to anwser below this question
3. 延时分析