如何定位前端线上问题(如何排查前端生产问题)

  怎样定位前端线上问题,一直以来,都是很头疼的问题,由于它发生于用户的一系列操做以后。错误的缘由可能源于机型,网络环境,接口请求,复杂的操做行为等等,在咱们想要去解决的时候很难复现出来,天然也就没法解决。 固然,这些问题并不是不能克服,让咱们来一块儿看看如何去监控并定位线上的问题吧。 javascript

 

  背景:市面上的前端监控系统有不少,功能齐全,种类繁多,无论你用或是不用,它都在那里,密密麻麻。每每我须要的功能都在别人家的监控系统里,手动无奈,罢了,怎么才能拥有一个私人定制的前端监控系统呢?作一个自带前端监控系统的前端工程狮是一种怎样的体验呢?html

 

  这是搭建前端监控系统的第二章,主要是讲如何对js错误进行监控,跟着我一步步作,你也能搭建出一个属于本身的前端监控系统。前端

  若是感受有帮助,或者有兴趣,请关注 or Star Me 。 java

 

    请移步线上: 前端监控系统git

 

  1、统计前端错误(Demo

  众所周知,咱们有办法去统计前端的错误,那就是大名鼎鼎的 window.onerror 方法, 用法以下:github

    // 重写 onerror 进行jsError的监听
    window.onerror = function(errorMsg, url, lineNumber, columnNumber, errorObj)
    {
      var errorStack = errorObj ? errorObj.stack : null;
      // 分类处理信息
      siftAndMakeUpMessage(errorMsg, url, lineNumber, columnNumber, errorStack);
    };
  window.onerror 方法中参数的意义我就不一一介绍了,我相信你们也已经耳熟能详了。 总之它可以为咱们记录下线上的不少错误,以及一些额外的信息。我将window.onerror(捕获异常),console.error(自定义异常)方法收集到的错误信息进行分析统计后的结果以下:

        

    如上图所见: 咱们统计出了天天的错误量,每一个小时的错误量,天天的错误量变化,来鉴定咱们线上环境是否健康。咱们按照JS错误数量进行分类排序,按照页面进行错误分类。经过上边的数据分析,咱们可以清晰地观察到线上项目的报错状况。web

  2、分析错误详情

  线上的错误日志统计出来了, 如何解析这些错误日志呢。以下图,解析出用户的机型,版本,系统平台,影响范围,以及具体的错误位置, 从而提升咱们解决问题的效率。网络

    

 


 

   疑问?

  window.onerror 方法可以利用的地方都已经用的差很少了,可是它真的能够帮咱们定位和解决前端线上的问题吗?学习

  线上可以修复的问题我已经尽可能修复了,可是线上的问题频发。 当客服反馈一个问题, 你发现没有测试机型,没法复现用户错误的时候,让你来修复这个问题,只能两眼一抹黑,无能为力。测试

  例如:线上用户进过了复杂的连接跳转而发生了错误;用户调用的接口发生了异常或者超时;线上的用户反馈异常根本就跟实际状况不符,等等。这些非直观型的问题该如何解决? 因此,咱们须要用户的行为记录。

  3、记录用户的跳转行为(Demo

  有些错误是前端页面通过复杂的跳转、回退以后才发生的,就算测试人员也很难测试出这种问题,由于线上的用户的任何行为都有可能出现。每每咱们知道的只是他在最后停留的页面发生了错误。 如此,咱们记录下用户的跳转日志, 就可以复现出用户的行为, 从而复现BUG

  

 

  4、记录用户的接口行为

  接口请求是一个前端项目涉及最多的行为,接口的异常包括:后台报错,响应超时,网络环境较差,重复接口数据覆盖等等。这些错误也只有在真实的用户环境中才会发生,是典型的线上问题。咱们能够记录下用户的请求时间,参数,响应时间,响应状态等等,能够具体分析出来接口对页面的影响。

 

 

  5、记录用户的点击行为

  用户通过一系列复杂的行为操做以后(主要是点击行为),页面的样子和保存的数据都通过了不少变化,此时此刻最容易发生数据错乱的现象,致使修复bug的时候无从入手,是复现用户行为中重要的一环。

     

  6、记录用户的页面截图

  即便你记录下全部的行为,可是你依然须要看到页面的样子,才可以分析出问题所在,那么咱们依然能够经过js截图来看看用户设备上的样子。

  

  7、分析用户的场外信息

  当用户全部的行为都被咱们掌握以后,咱们可以复现出用户的行为,甚至可以复现出用户的问题,也许咱们还须要一些场外信息才能精准定位问题,好比,用户的机型,地理位置,系统版本,当时的网络环境(这个不许确,我是依据用户当时首次加载页面的时间来判断,只能做为参考依据)

  


 

  总结:

   问题产生的缘由五花八门,只有把日志作全了,才可以准确的定位和解决问题。

   这是我排查线上问题的经验和实战,分享出来,以求分享和学习。

 

   说了这么多都没有直接体验直观,请移步。 Demo地址 

相关文章
相关标签/搜索