基于正态分布的前端性能数据分析(一)

原文 基于正态分布的前端性能数据分析(一)前端

前言

公司的前端项目是上报了各项性能数据的,如首屏时间、onload时间、网络用时等;因为用户可能处于各种环境中,如不一样的网络环境、机型差别、同一手机的不一样运行状态等,致使性能数据会有较大的波动,而这些异常数据对平均值的影响是很是大的,所以不能简单地用平均值描述性能情况,而应该作更加深刻地分析数据。
经过对性能数据的统计分析,咱们但愿获得性能数据的分布状况,监控上线先后的性能变化,甚至运行期间的性能波动,分析缘由出在哪一个环节,从而有针对性地优化项目;而且针对每一次优化,咱们可以定量地肯定优化成效有多大,而不是“嗯,好像优化有效果,在个人电脑上都变快了”
ps:因为不是专业作数据分析的,分析过程若是有不合理的地方,欢迎指正。segmentfault

探索

因为咱们主要关注用户的首屏时间,所以我这里拿到了一周内首屏数据的抽样结果(约13万条),为了了解首屏时间的分布状况,我以50ms为间距统计各个时间段内的数据量,绘制折线图结果以下:网络

clipboard.png

能够看到数据分布比较对称,曲线呈钟形,数据主要集中在550ms附近。
在传统的统计分析当中,不少时候咱们都但愿用正态分布来分析数据,就算不符合正态分布的数据,也有可能将原始数据转换为正态数据。
从上图能够看到,咱们的数据是比较符合正态分布的特征的,所以咱们能够尝试使用正态分布来分析。
因为segmentfault对数学公式支持不太友好,剩余内容请参考原文前端性能

相关文章
相关标签/搜索