线上问题已经解决，这就完事了？

时间 2021-04-06

标签 npm 小程序微信小程序微信并发 app 框架函数测试 this 繁體版

原文原文链接

1. 前言

做为一名自信的 QA，对于测试经过的项目，若是有人反馈有问题，脑海中的第一反应必定就是：不可能！必定是操做有问题。入职以来经手大大小小的项目也有 40 多个，一直没出过问题，也让我在年度的总结上自信地写到：全部项目按时按质发版，未出现线上问题。npm

可是，这种自信让我掉以轻心，使得微信小程序 SDK 的第一个线上问题也随之而来了。小程序

对于线上问题，可能不少人都觉得把问题解决了就完事了，并不重视对问题的复盘。事实上，复盘的做用可能远大于解决问题自己。微信小程序

在神策的企业文化中重要的一项就是复盘，每个问题对于咱们来讲都是一笔宝贵的财富。经过对于问题的复盘，总结经验教训，可以更好地促进咱们成长。微信

下面咱们来看下对于这个问题是如何进行复盘的。并发

2. 回顾目标

神策微信小程序 SDK 的目标是实现对于主流小程序开发框架的全埋点功能。可是，在测试过程当中发现因为 Taro3.0 框架从新定义了标签点击行为的逻辑，使得一次点击行为会触发 SDK 的两次点击事件 $MPClick，形成了埋点数据重复。app

所以，此次发布的 v1.14.3 版本旨在解决 Taro3.0 框架下点击事件重复触发的问题，实现神策微信小程序 SDK 真正意义上的无框架障碍全埋点采集。框架

3. 评估结果

3.1. 符合目标

解决了 Taro3.0 框架下点击事件重复触发的问题；
实现了神策微信小程序 SDK 真正意义上的无框架障碍全埋点采集。

3.2. 低于目标

本次发布的版本存在严重的线上问题。

4. 分析缘由

4.1. 回顾过程

2020 年 12 月 17 日 19 : 05 微信小程序 SDK 发布了 v1.14.3 版本，新增了 $MPClick 事件可自定义属性，修复了 Taro3.0 框架下点击事件重复触发的问题；
2020 年 12 月 18 日 16 : 27 技术顾问收到客户反馈：微信小程序 SDK 更新到 v1.14.3 版本后，测试过程当中发现 SDK 篡改了他们方法的返回值，属于破坏型 proxy；
2020 年 12 月 18 日 16 : 30 技术顾问查看代码发现这个问题之前在支付宝小程序出现过，并和 QA 一块儿复现了问题；
2020 年 12 月 18 日 16 : 35 问题同步给研发和 QA 组长，并分配下一步具体工做：QA 去 GitHub 上删除对应版本代码，研发组长协助删除 npm 上的版本，研发开始修复问题；
2020 年 12 月 18 日 16 : 37 研发组长和 QA 完成版本删除；
2020 年 12 月 18 日 16 : 45 研发修复完成，交由 QA 测试；
2020 年 12 月 18 日 18 : 05 QA 测试完成，并发布了最新的修复版本 v1.14.4，完成了线上验证；
2020 年 12 月 19 日 11 : 31 技术顾问组长找出了全部使用问题版本 v1.14.3 的客户并同步给技术顾问；
2020 年 12 月 19 日 15 : 00 技术顾问通知了全部使用 v1.14.3 的客户，告知他们存在的问题并提醒他们更新版本。

整个问题的生命周期从 2020 年 12 月 17 日 19 : 05 发版，到 2020 年 12 月 19 日 15 : 00 全部客户通知完成，总共历时 44 个小时。能够分为如图 4-1 中的 6 个阶段：函数

图 4-1 线上问题生命周期测试

此次问题是我经历的第一个线上问题，此次经历不只让我完整了解到线上问题的处理流程，更让我充分地感觉到各个环节上团队人员的密切配合。从问题开始到问题解决，小程序团队全员时刻处于待命状态，每一个环节都争分夺秒，确保了这次问题的快速修复，没有形成较大的影响。this

回顾线上问题的整个过程以后，咱们须要分析产生这个问题的具体缘由。

4.2. 缘由分析

4.2.1. 自动采集点击事件

在进行具体的缘由分析以前，咱们先来看下神策微信小程序 SDK 自动采集点击事件的原理。

一、在重写 Page 函数时，先经过 _.getMethods 获取除 Page 钩子之外的自定义事件处理函数集合 methods：

`Page =` `function` `(option) {`

 `//` `先判断 mpClick 是否配置自动采集，若配置为真则获取自定义方法并代理重写`

 `var methods = sa.para.autoTrack && sa.para.autoTrack.mpClick && _.getMethods(option);`

 `if``(!!methods) {`

 `for``(var i = 0, len = methods.length; i < len; i++) {`

 `//` `对 methods 集合的每个自定义事件处理函数进行重写`

 `click_proxy(option, methods[i]);`

 `}`

 `}`

`}`

`//` `_.getMethods 方法，获取用户自定义的全部事件`

`_.getMethods =` `function``(option) {`

 `var methods = [];`

 `for` `(var m` `in` `option) {`

 `if` `(typeof(option[m])===``'function'` `&& !mpHook[m]) {`

 `methods.push(m);`

 `}`

 `}`

 `return` `methods;`

`}`

二、对 methods 集合的每个自定义事件处理函数进行重写，获取事件触发时的 type 类型，type 为 tap、longpress 或者 longtap 则触发 $MPClick 事件，将 wxml 文件标签中 dataset 定义的属性做为事件属性：

`//` `点击事件代理处理函数`

 `function` `click_proxy(option, method) {`

 `var oldFunc = option[method];`

 `option[method] =` `function``() {`

 `//` `在重写 oldFunc 以前就已经判断是一个方法类型，此处是作一次重复的校验`

 `var res = oldFunc.apply(this, arguments);`

 `var prop = {},`

 `type` `=` `''``;`

 `if``(_.isObject(arguments[0])) {`

 `//` `将 wxml 标签中 dataset 定义的属性做为事件属性`

 `var dataset = current_target.dataset || {};`

 `type` `= arguments[0][``'type'``];`

 `prop[``'$element_id'``] = current_target.``id``;`

 `prop[``'$element_type'``] = dataset[``'type'``];`

 `prop[``'$element_content'``] = dataset[``'content'``];`

 `prop[``'$element_name'``] = dataset[``'name'``];`

 `}`

 `if``(``type` `&& _.isClick(``type``)) {`

 `prop[``'$url_path'``] = _.getCurrentPath();`

 `sa.track(``'$MPClick'``, prop);`

 `}`

 `return` `res;`

 `}`

 `};`

`//` `点击类型判断方法`

`_.isClick =` `function``(``type``) {`

 `var mpTaps = {`

 `"tap"``: 1,`

 `"longpress"``: 1,`

 `"longtap"``: 1,`

 `};`

 `return` `!!mpTaps[``type``];`

`}`

点击事件的自动采集不只能采集到用户的点击行为，还能自动采集点击标签的相关属性。
只要在 wxml 文件的标签中经过 data- 定义的属性均可以采集到，能够自动采集的属性如表 4-1 所示：

表 4-1 自动采集的属性

建议在元素中定义 id 、data-content、data-name 这三个元素之一做为元素标识，若无这三个属性，则在神策分析平台没法进行标识。

接下来，咱们来看一个自动采集点击事件的例子。

一、配置以下的 button 标签：

`<button bindtap=``"test"` `data-name=``"button"` `id``=``"button"` `data-content=``'button'` `data-``type``=``"button"``>测试<``/button``>`

二、点击 button 后触发的事件内容以下所示：

`{`

`"distinct_id"``:``"1610349175397-726909-0e567a51188708-20891891"`

`"lib"``:{`

`"$lib"``:``"MiniProgram"`

`"$lib_method"``:``"code"`

`"$lib_version"``:``"1.14.4"`

`}`

`"properties"``:{`

`"$lib"``:``"MiniProgram"`

`"$lib_version"``:``"1.14.4"`

`"$network_type"``:``"wifi"`

`"$manufacturer"``:``"devtools"`

`"$model"``:``"iPhone 6/7/8 Plus"`

`"$screen_width"``:414`

`"$screen_height"``:736`

`"$os"``:``"devtools"`

`"$os_version"``:``"10.0.1"`

`"$timezone_offset"``:-480`

`"$app_id"``:``"wx82a49f7cb5547449"`

`"$url_path"``:``"pages/index/index"`

`"$element_id"``:``"button"`

`"$element_type"``:``"button"`

`"$element_content"``:``"button"`

`"$element_name"``:``"button"`

`"$is_first_day"``:``false`

`"$ip"``:``"117.71.111.48"`

`"$browser"``:``"WeChat"`

`"$browser_version"``:``"7.0.4"`

`"$is_login_id"``:``false`

`"$city"``:``"合肥"`

`"$province"``:``"安徽"`

`"$country"``:``"中国"`

`}`

`"anonymous_id"``:``"1610349175397-726909-0e567a51188708-20891891"`

`"type"``:``"track"`

`"event"``:``"$MPClick"`

`"time"``:1615194119222`

`"is_login_id"``:``false`

`"map_id"``:``"1610349175397-726909-0e567a51188708-20891891"`

`"user_id"``:-8183290914376425000`

`"recv_time"``:1615194119222`

`"project"``:``"gongcheng"`

`}`

至此，咱们能够看到自动采集了 button 的点击事件。

4.2.2. 具体缘由

了解了微信小程序 SDK 是如何实现自动采集点击事件的原理，这次问题的缘由就比较容易分析了，下面咱们看下致使这次问题的具体缘由是什么。

一、首先咱们须要了解下小程序的页面逻辑，每一个页面都有一个单独的 JS 文件为页面组件添加执行逻辑，全部方法都写在 Page( { } ) 中，主要包含三个部分：页面的初始数据，小程序自己带有的生命周期函数和自定义的函数方法。例以下面示例中定义的两个方法 testA 和 testB：

`Page({`

 `/**`

 `* 页面的初始数据`

 `*/`

 `data: {`

 `},`

 `/**`

 `* 生命周期函数--监听页面加载`

 `*/`

 `onLoad:` `function` `(options) {`

 `},`

 `/**`

 `* 自定义方法 testA`

 `*/`

 `testA:` `function` `() {`

 `console.log(``'执行方法 B'``,this.B())`

 `},`

 `/**`

 `* 自定义方法 testB`

 `*/`

 `testB:` `function` `() {`

 `return` `'执行方法 B'`

 `}`

`})`

二、根据上一节提到的点击事件自动采集原理，咱们对客户小程序的全部自定义方法进行了重写代理，判断 type 类型为点击时触发 $MPClick 事件，但前提必定是不能影响客户自定义方法的执行；
三、小程序 SDK v1.14.3 版本在更新现有逻辑时，修改了代理方法的返回值，由返回客户方法的执行结果改为了直接返回 false，如图 4-2 所示：

图 4-2 小程序 SDK v1.14.3 版本代码 diff 图
四、这就使得上面代码中 Page 自定义的方法 testB()，本来客户业务逻辑是 “return '执行方法 B'”，可是通过咱们 SDK 的方法重写，变成了 “return false”。
五、testA() 原本应该打印出 testB() 中定义的返回值，不过因为 SDK 代理使得 testB() 返回 false，致使 testA() 的执行结果不符合预期，如图 4-3 所示：

图 4-3 testA() 的错误执行结果
正确的业务逻辑执行结果应该如图 4-4 所示：
图 4-4 testA() 的正确执行结果

4.2.3. 解决方案

知道了问题的缘由以后，解决问题就比较容易了。只须要在代理客户方法时修改返回值为客户原来方法的返回值，如图 4-5 所示：

5. 总结规律

5.1. 经验教训

虽然这次线上问题的缘由比较简单，可是通过深入的检讨以后，我总结了以下几点经验教训：

QA 对代码的改动须要具备敏锐的感知，要详尽追究每行代码改动的目的。对于代码的 diff，必定要知其然，知其因此然。QA 可能不须要编写很复杂的代码，可是必定要能看懂代码，不然测试覆盖率必定不高；
这次问题的发生主要在于 QA 的测试 case 未覆盖到方法的返回值，对于小程序基本原理理解的不够深刻。所以，QA 须要对测试的业务很是熟悉，经过业务属性探索测试 case；
QA 没有遵照流程，在研发组长没有给出 code review 经过的回复以前，就直接开始测试。这样使得测试代码是未通过 double check 的，很容易出现问题；
这次问题属于再犯，以前在其余小程序上也出现过一样的问题。这种再犯的问题是最可怕的，代表了没有对出现的问题作好总结。对于 QA 而言，须要将漏测的 case 加入回归测试的 case 中，按期对回归测试的 case 进行总结。

5.2. 问题

经过这次线上问题暴露了本身做为一名 QA 所存在的一些问题：

对于 SDK 代码和小程序基本原理还不够熟悉；
对于代码的改动没有追根究底，相关逻辑的了解不够充分；
没有严格遵照测试流程；
没有及时总结已有的问题，致使一样的问题再次出现。

5.3. 改进

通过这次线上问题的复盘，有以下行动做为改进的方向：

QA 在 2021 年的 Q1 季度完成对微信小程序 SDK 代码的熟读，研发负责组织 2 次以上针对 QA 的小程序基本原理培训，从而让 QA 和研发在代码理解上达到水平一致；
研发在之后项目中须要详细评估改动，准肯定位影响范围，并在相应的提测邮件上重点备注，让 QA 能更详尽的设计测试 case；
这次问题以后，QA 和研发都须要严格遵照开发测试流程，相互监督，毫不在任何一个流程环节中出现越界或者违规；
QA 在 2020 年 12 月底以前完成对这次问题的详细总结，并把漏测的 case 加入到回归测试 case 中，防止再次出现一样的问题。

6. 结语

本文经过对于一次线上问题的复盘，介绍了复盘的总体流程，但愿经过本文能给你们提供一些复盘相关的参考。