论测试用例的有效更新及杀虫剂悖论

时间 2020-10-14

标签 windows 后端服务器 ide 工具测试字体优化 spa 插件栏目 Windows 繁體版

原文原文链接

论测试用例的有效更新及杀虫剂悖论windows

在2014年，咱们团队试图推进一件事情——把产品后端（客户、客服、生产制造等等）出现的问题，反向增补为测试用例，扩充到测试用例库中，避免后续重复的出现问题——早些年柳传志在创业类的节目问一个选手，做为老板，你天天第一件要处理什么事情。选手按照本身的优先级和重要性说了一堆。柳传志说：你应该优先处理反复出现的问题。后端

复盘论是联想的看家本领，这也仅借用一下这个意思。服务器

尝试这么作了一段时间，把已经造成的反向增补测试用例，推广到相关测试用例库，而后在实际中执行和检查，一段时间大体有以下几种现象：ide

1、绝大部分，根本不执行。工具

2、小部分，有选择的执行。测试

3、小部分，从新编写，归入到原有的测试用例中执行。字体

第一种现象的缘由有不少种，光明正大的以及不那么光明正大的——我更愿意认为是下文会提到的缘由。优化

对于第2、三种现象，我被反问的问题是：若是没有按照咱们写好的格式，单独的拉取出来并有执行结果，那么就没法经过人工或者工具来统计这些新增的用例是否被执行过？数据拿不到，由此就不能判断你们在测试方面是否有优化和进步。spa

先暂时放下复杂的执行和检查的针对性问题，仅仅从测试自己——一个问题出现，是否要把这个问题出现的步骤、缺陷的场景，相似可能出现的逻辑，都写在测试用例中，在后续的项目中，反复的执行？插件

答案是不必定——测试设计是一个领域的高手才作的事情，而不是单纯的有一说一的死板描述。或者换个说法，测试用例是测试工做的核心，是充满创造力的事情，而不是能够有一个什么绝对正确的方法论，就能够一劳永逸搞定的。

列举一些不一样的例子，来展现表象和本质之间的复杂关系：

1、问题产生的缘由，它的频率是什么？

EX1——若是问题是由于开发人员错手把一段代码注释，或者由于各类笔误产生的缺陷，发现以后修改代码从新编译，问题解决。

那么这种问题的几率就是一次性的。这个缺陷修复后，再次出现的几率就很是小——除非这代码是别人留下来的，而后换个开发，又胆大的修改了一些老代码。而后本身的组长尚未代码审核，直接提交了。那么这问题才有可能重见天日。正常针对这种状况，是没有必要写上几条case，后续的项目每次都执行的。

EX2——有一个资源，多个模块都会调用，并且这几个模块业务逻辑耦合的较为紧密，并且联调一直作的很差，甚至由于解决缺陷还发生过屡次扯皮究竟是你的个人他的等破事儿。

那么这种问题应该是有几率出现的。这个缺陷修复后，不只仅这条缺陷产生的操做后续要增补，甚至这几个模块调用资源的一些方法，以前没有太过注意，后续也要适当的增强测试设计。

2、问题涉及的组件、分支流、版本多少状况？

EX3——在嵌入式设备中，“兖”字没法显示，显示为“口”。问题的缘由是在嵌入式设备内存较小时，可能字库采用的是一级字库，那么可能全部的二级字库的文字都会显示异常。

2.一、具备惟一性：

若是全公司使用的都是统一的font字库。那么只更新这个font，全部嵌入式设备的二级字库问题都会获得解决，这个缺陷一次性修复后，就不须要归入到测试用例。

2.二、存在多分支：

有好多的外包项目，要显示不一样字体、不一样国家的语言，简而言之就是有好多的分支font存在。

2.A、若是有好的全面的缺陷分析和波及通知方式，你们各自修复，也不须要写到测试用例中，由于是一次性的行为。

2.B、若是有必定的缺陷知会方式，不一样的分支流能够感知，可是时效性较差，那么这事儿就要固化在测试用例中，执行上一段时间。

2.C、若是没有必定高度的缺陷知会方式，你们基于一个流，后续各自开发维护，那么确定要写在测试用例中，甚至要组织小的专项测试，来集中暴露不一样版本的问题。

3、是否有强顺序依赖关系？

EX4——若是一个问题，和业务逻辑顺序强相关，须要通过必须的一、二、三、四、5等步骤，才会致使一个必然的bug。从测试人员的本职工做来讲，能发现这样的bug（俗称神级bug），简直是本身对业务知识了如指掌的最好表现，甚至能够做为本身的江湖轶事不断的吹嘘下去。

可是，这种bug，回归测试以后，真心不用把它造成测试用例，让后面每个项目，都去反复的执行——强业务顺序关系修复了，后续天然不会出现。至因而否有其余隐含的逻辑，是否须要进行其余的分支状态测试，那是另一回事儿。

4、验证条件具不具有？

EX5——各类复杂的外厂商对通问题。

此类的bug，可能是在现场，经过抓包分析、码流分析，而后不停的替换临时版本才能修复。若是是协议标准化方面，能够在测试环节增强，若是是各厂家飞速发展中产生的非标协议，谁也没办法，只能现场解决。

因此，你能够写一条，A设备，须要接入甲厂家的XXX产品/乙厂家的YYY产品，进行ZZZ功能测试。可是，这些测试用例，不具有可执行性。

对于此类的互联互通问题，最好的解决方案是，找到一个设备型号不少的客户，维系好客户关系，发布新产品的时候，本身带台设备过去，联调就搞定了。

这个例子须要的是此类问题的测试策略和方案，而不是生硬的补充没法执行的测试用例。

EX6——长时间运行后致使的问题，好比XX设备运行三年后，器件老化，或者版本、文件无端丢失。

这就分别涉及了可靠性和flash反复读取，碎片和黑天鹅事件等。

测试这类的问题，要在短期内模拟三年的效果，只能是经过上测试设备量，以及经过公式推导大概的稳定性。写在测试用例里面，在平常的工做中，显然是没法实现的，还不如老老实实的作专项测试，集中人力、设备等等。把此类问题一次性搞定。

以上是由缺陷反向提炼测试用例的第一个概念——从问题中汲取经验，避免之后再犯一样的问题，思路和逻辑都是对的。可是绝对不意味着比着葫芦画瓢，有的问题可能就是一次性的，有的问题背后可能有更大的问题，有的问题你知道可是还只能看几率和投入产出比，或者尝试经过其余方法来解决。

第二个概念和团队和人有关系，一个团队真实的运做，每每只有内部人知道。同理，问题产生的真实缘由，每每是一个团队内部被隐藏的，因此是否能写出精准的测试用例，也只有团队内部本身人才能搞的定。这就意味着若是测试用例更新不是本身部门内部主动触发，而是第三方部门（质量部门、流程部门）驱动的，那么就注定只会拿到一些样子货。

5、问题产生的真实缘由，会让你写的case彻底不同。

举个例子：软件客户端解码无声音。

可是若是你增长一条测试用例：“软件安装/更新成功后，查看编解码状态是否正常，预期结果：图像、声音正常。”拿到这条用例的人会认为编写人秀逗了，这么基本的东西早就测烂了，还正儿八经的新增，最后的结果要么是不执行，要么就是无脑打钩经过。

但这个最基本的问题，会一次次的出现，背后天然有深层次的东西存在。

EX7：兼容性问题，某音频格式通过翻转，未考虑兼容性。

早期版本的音频码流发过来，解码失败，这种无声音就是标准的兼容性问题——因此增补测试用例，就要写成，和各产品各版本进行兼容性测试，看视音频是否正常。

看起来是否是抓到实际问题了？可是这种用例也是理论上的全面用例，实际也不可能会被执行（参考6、测试用例的可执行性）——历史产品可能有二十几个，历史版本可能也有二十几个。你动动嘴皮子互联互通，且不说是否是测试环境有这么多设备，就是在一切顺利的状况下，版本更换并测试一轮，也要个几个工做日。在测试资源、时间一向紧张项目背景的下，这条case会被执行才怪。

结合上面的观点，看编解码组件的版本是否有变动，而后再决定是否执行编解码不一样版本之间的兼容性测试，而后经过等价类，选取产品和版本，让测试执行在半个小时到一个小时能够被执行，才是正解。

EX8：DLL被覆盖的问题。系统先装了产品的的编解码插件，而后又装了其余的播放器（暴风影音、千千静听都出现过此问题），同名编解码插件被覆盖，解码失败。

此类的问题，排查过程可能比较纠结，可是排查清楚后，是否要写条测试用例，之后每次都归入执行呢：“首先安装我司产品，而后安装暴风影音，进行编解码，看是否正常。预期结果：视音频正常。”这种用例是否可执行？

看解决问题的方案是什么：

8.一、若是解决方案是销售规避——服务器是独立安装的，所装软件都是有标准版本，不容许安装其余软件，那么这个问题根本就不须要解决。只须要卸载非容许软件，从新安装一次便可。

8.2若是解决方案是统一把dll的路径由system目录，修改到指定的目录，规避dll被覆盖的问题。那么这条case就须要执行一段时间，而且要明确检查，setup以后，查看XX路径下的XX文件，是否更新成功这条检查项。

8.3若是解决方案没有统一指定，每一个软件团队都是本身指定目录，且dll的特性不同，有多个版本在同时使用，那么必然会存在本身公司多款软件调用dll冲突的现象，或者绝不客气的说，部分人员连dll搜索路径“当前目录->system目录->windows目录->环境变量Path指定的目录”都没有考虑。那么这事儿若是要暴露，就要找几我的成立专项测试，甚至要周期性进行检查了——可是一旦恶劣到这种状况，就是各软件产品没有统一的规则，你们关起门来本身按照本身的想法设定，并单纯的认为客户只会安装一款产品。若是是我，确定罢工——系统部门坐下来定个规则，你们一块儿修改一下，就能够一劳永逸，分分钟的事儿。结果把问题甩给后端团队，找几我的费工费时，长期的去折腾。这是不拿别人当人看，也没有考虑项目总体成本，或者干脆就是没有尽到责任，凭什么让测试人员来背锅？

一个看起来相同的现象，由于产生缘由的不一样，可能采用的行动是大相径庭的。若是你不在项目组里面，不对里面的缘由了如指掌。只是单纯的督促某一我的员，这事儿是否是你的问题？这反而容易激发逆反情绪，对总体推动产品，会产生很是大的负能量。

6、测试用例的可执行性。

上文已经举了一个例子。凡是随意的写出穷率测试的测试用例，都是不负责任的。

A：我写了遍历全部的接口，全部的格式，清清楚楚，你怎么没有测到？

B：你算过你这一行实际要测试多少时间么？你写一句话，我要折腾一个礼拜。

出了问题，你说你想到了，是执行人员偷懒，可是这么紧张的测试时间，不可能给一个礼拜的时间去测试这么一个基本功能。测试优先级、测试等价类划分，甚至根据客户使用几率作带风险的暂不测试决定，不是测试设计该作的事儿么？

造成一张图表来阐述观点。

这张表的目的并非死记硬背，而是当你思考“这个问题的产生，咱们要不要写条case，而后一直去执行它？”的时候，可以根据本身产品的实际特色，作出正确的分析判断就能够。

因此回归一开始的问题，若是是按照冷冰冰的规范约定，全部的问题都必须归入到缺陷进行管理。在面对复杂多变的种种现实状况时，落地的样式可能会多种多样（不须要、选择执行、长期例行覆盖、短时间覆盖、专项重点解决）。

第三方部门的种种检查方法，可能并不能套用到一条条的用现有用例中，而趋利避害的本能，向不了解业务的人，讲解清楚的原因和解决方案是很是麻烦的事情。因此每每实际的产品验证方，与其试图无谓的解释清楚一二三四，还不如干脆作表面文章，写几条看上去通俗易懂的测试用例，你们反而会过的舒服一些。

按照驱动力3.0的概念，胡萝卜大棒会扼杀别人的积极性和创造力，因此经过智力定位而且写出足够牛B的测试用例这种高大上的行为，经过标准化、检查化的方式，每每会被变成写水文的应付行为——这不是本文的重点，就稍微点到为止。

回归测试用例更新、优化自己。

除了由缺陷提炼出测试用例进行反向增补外，测试用例的基准库，也要定时评审修改更新的。

这就是测试用例中的杀虫剂悖论（pesticide paradox）——对软件进行越多的测试，那么该软件对软件测试人员的测试就越具备免疫力。或者字面理解，若是地里长期只打一种农药，那么虫子（bug）就会产生抗药性，致使效果愈来愈差，最后杀不死虫子。或者换个维度来描述：测试用例就是一种数据量化指标，你想考核什么，久而久之就必然会获得这种量化结果，可是对事情实际的提高，可能帮助不大。

可能一些测试用例在设计时是针对当时产品的一些薄弱环节。可是几个项目测试完成，甚至几年以后，这些测试用例的有效性就趋于为0。

一、多是代码逻辑修复，此类问题不再会出现；

二、多是软硬件变动，原来的测试方案须要调整；

三、多是功能点优先级变化致使的测试用例优先级调整等等。

举个例子，曾经在测试用例中，要求把版本放在发布服务器以后，须要从新下载后，进行一次安装测试，确认各模块的版本号信息。这在当时的条件下，是必然的一个测试步骤。缘由1、曾经出现过用不一样的解压软件和断点续传下载工具，致使文件字节数大小不一致的问题；2、原来版本是一个文件夹，其中有各类ini、exe、bin、setup文件，很容易出现测试版本和发布版本不一致的现象；因此从新进行安装后检查版本，是很是必要的行为。

可是过了几年以后，解压缩软件愈来愈多，兼容性愈来愈好。覆盖解压软件愈来愈不可能，还不如指定解压软件及版本号更现实；发布文件自己也不是一个文件夹，而是一个或几个Zip包，也避免了人工复制粘贴多个文件，人为混乱的风险；3、数据校验也作的比以前好多了，不必采用土鳖的方法手动核实。

因此，这条用例，毫无疑问能够删除掉，毕竟下载、替换、看版本号，怎么说也要两、三个小时才能搞的定。

经年不变的测试用例，从工做性价比的角度来讲，这就是无效的工做内容。就好像站在楼梯口的服务员，仅仅是由于传统而站在那里，而不知道一开始仅仅是为了提醒你们楼梯的油漆未干。

从测试职责和风险来说，这就是推卸管理者的职责。不管怎么说，常年不变的测试用例，就意味着多年没有进步的测试团队，这是毋庸置疑的。