本文首发于知乎 《阿里UC百亿级PV的前端监控平台实践》 ,搬运转载请注明出处,不然追究版权责任。javascript
阿里UC百亿PV的岳鹰全景监控平台实践 系列文章:html
Web承载的业务愈来愈复杂,用户对于Web的体验要求也愈来愈高,Web性能的优劣对业务收益也有着很是直接的影响。前端
本文主要介绍阿里UC百亿级PV前端监控平台, 岳鹰全景监控平台 的实践历程 - 大数据分析,阅读时长 5 分钟。java
获取到数据仅仅是第一步,一个极致的监控系统须要沉淀有效的分析方法,帮忙开发者高效的定位和解决问题。git
基于Elasticsearch存储的日志,能够很是方便的聚合各类维度报表;在海量数据的场景下,还能够引入Spark Streaming等实时计算引擎达到「1分钟实时分析」,更快速的发现问题,把问题影响面控制到最小。github
这里介绍的更可能是咱们如何经过自动的聚类和维度统计,提供一套高效的监控分析手段。web
对于数据分析,咱们分为大盘分析和单用户分析,大盘分析指的是经过各个维度快速识别 规模性的问题,而单用户分析则是分析 单点问题的利器。小程序
时间维度微信小程序
按照时间线的粒度,一般能够分为 分钟级别、小时级别、天级别的统计。微信
对于异常问题,分钟级别的时间粒度统计,能够在问题发生的第一时间通知到开发者;
而对于性能这种周期指标,经过小时和天级别的时间粒度统计,能够观察更长时间的变化趋势。
运行环境维度
前端页面的运行环境,例如网络类型、运营商、地域,操做系统,设备机型信息等。
为何运行环境维度的分析也这么重要?页面加载的大量静态资源和AJAX请求都须要通过网络运营商、CDN厂商,劫持、网络/CDN抖动、资源404等状况比比皆是。
细粒度的代码追踪
JS异常的代码栈顶信息,定位到发生异常的代码位置和异常堆栈;API请求异常的响应错误码和响应内容,定位到具体的API错误类型和缘由。毫无疑问这是开发者解决问题是最须要等信息了。
单用户分析
一个异常是怎么发生的,须要将异常操做的先后时间线串联起来观察。它不仅仅涉及一次用户操做,甚至不限于某一个页面,而是一连串事件的表现。
经过将用户访问过程的异常和请求日志链接起来,造成用户访问页面的时序,以动态的效果输出发生异常的过程;而且能够把业务的关键节点也关联起来,例如页面的点击操做等。
这样能够提供很是详细的现场还原效果,在解决具体用户遇到的错误时很是有效。
阿里UC出品的 岳鹰全景监控平台 ,支持移动H五、PC站点、微信小程序以及支付宝小程序等各家小程序,PV、JS异常、页面性能等监控指标完整,已经对外开放,欢迎免费体验试用。
技术交流、第一时间掌握产品动态,欢迎联系微信小助手~