2020北航OO第三单元总结

时间 2020-05-23

标签北航第三单元总结繁體版

原文原文链接

2020北航OO第三单元总结

本单元要求是根据JML规格完善代码，初看是一个简单的代码照搬实现的东西，但最后才发现因为CPU时间的限制，还考察了大量优化策略及数据结构中关于图的知识，是一次很是注重细节构思的一单元，我借此机会学习并巩固了好几个图的算法，并了解了java各种容器的查插删改的效率。java

1、JML理论基础

JML(Java Modeling Language)是用于对Java程序进行规格化设计的一种表示语言，它至关于一种接口，正确的JML能够给实现人员清楚的代码要求，而且针对已有代码书写JML也能够提升代码的可维护性、可读性。经我使用看来，它有以下几种关键要素组成：算法

位于类一开始的//@annotation的属性定义，它规定了类必含的属性（固然也能够由其它形式所展示），在以后的方法规格中会用到这些定义缓存
变式invariant，要求在全部可见状态（凡是会修改为员变量（包括静态成员变量和非静态成员变量）的方法执行期间，对象的状态都不是可见状态）下都必须知足的特性数据结构
状态变化约束constraint，对前序可见状态和当前可见状态的关系进行约束架构
pure关键词，表示某些纯粹访问性的方法，即不会对对象的状态进行任何改变，也不须要提供输入参数，这样的方法无需描述前置条件，也不会有任何反作用，且执行必定会正常结束函数
前置条件(pre-condition)，用requires关键词表示，定义调用者调用方法前必须知足的语句工具
后置条件(post-condition)，用ensures关键词来表示，定义调用者调用方法后必须知足的语句post
反作用约束子句，使用关键词assignable或者modifiable，表示调用方法后能够改变的变量学习
异常处理行为exceptional_behavior，用signals (Exception e) expr表示知足expr条件即抛出Exception异常，用signals only Exception表示知足前置条件即抛出Exception异常测试

其中，在规格表示时，大多数语句含义与代码相似，只需注意一下几个关键词的意含义：

\nothing，指空集；everything，指全集，一般用在assinable语句
\result，表方法示返回结果
\old(expr)表达式，表示一个表达式expr在相应方法执行前的取值
推理操做符：expr1==>expr2，即离散中的→
\forall表达式：全称量词修饰的表达式
\exists表达式：存在量词修饰的表达式
\sum表达式：返回给定范围内的表达式的和

2、JML应用工具链

OpenJML：相似于对代码的检查，能够对规格进行语法的检查
JMLUnitNG/JMLUnit：针对类自动生成测试样例并进行测试
JMLdoc : 相似 Javadoc，能够快速生成 JML 文档的相关文件

3、SMT Solver

下载了openjml，想要运行结果出现了一堆警告和error，相似于下面这种问题，\result都会被报错，但本身写的Demo里只有很简单的一个add方法，彻底摸不着头脑，并且openjml也不能检测forall、exsit等语句，只能放弃

public class Demo {
    //@ ensures \result = a + b
    int add(int a, int b) {
        return a + b;
   }
}

4、JMLUnitNG

通过一些奇奇怪怪的操做，我终于配置成功了jmluintng

我先对Person.java进行了测试，主要是先补齐new一个新对象时<>里的变量类型，并加上包名，其它内容并无改动，能够看出它产生的测试用例都是比较边缘的状况，如0、null、MAX_VALUE等，最后只贴出来出现fail的部分，集中在isLinked函数，缘由是输入为null的状况，这应该是不会在使用中出现的一种状况

以后我又进一步对Group.java进行了测试，结果以下

最后失败的还是null的状况。。。

我感受到，这实际上是一种很好地检验方法正确性工具，尤为体如今它对边缘状况进行测试的方面，但可能不是很适合比较复杂的状况（如咱们的图算法）

5、架构设计

先放UML图

看起来有点点复杂，但我在原有架构的基础上，其实只增长了两个类Edge和Bcc，一个表明图中的边，一个表明一个双连通块，经过增长这两个类，能够进行更好的双连通份量与最短路径的查询。至于优化的问题，因为都是在TLE以后才意识到须要进行优化，因此放在下部分讲

5、bug及其修复

此次做业的bug主要出如今算法的问题上，因为一开始都是机械地按照规格重现代码，因此致使不少点TLE了，最后bug修复完的算法以下：

采用hashmap进行存储查找，arraylist太慢，并对hashmap进行适当的初始化容量操做（最后的TLE就死在这上面）
对getValueSum和getRelationSum使用缓存机制，提早设置变量，在addRelation和addToGroup时进行即便修改
对blockSum进行缓存，并对每一个person进行block的标号，在addPerson时使blockSum++，在addRelation时合并block，并改变blockSum（这里在优化过程当中出现了一个bug，是由于没有区分好block的标号及blockSum，使得后加进来的人也会被打上以前block的标号）
经过每一个id的block号，可直接判断isCircle
对queryMinPath方法使用堆优化的Dijikstra，对于堆优化，采用了java有序队列PriorityQueue来存储，使Edge实现了Comparable的接口，而且每次添加的时候不用进行是否已经访问过的查询操做，由于他永远都是poll出最小值。这里也出过一个小bug，是因为我将每一个id初始的路径值设为了1001（value[0,1000]），但忽视了value是一个累加的过程。。最后改成Integer.MAX_VALUE，也是因为本身测试不充分的缘故，这其实只须要将每条边的value值设大一点就能够了
因为会有大量连续测最短路径的操做，我每查询一次就将查询结果以<id, values>的形式储存起来，若是有addRelation的改动就将相关节点删去，这样也能够减小大量重复的dijisktra查询操做（我的觉得qmp是此次的优化重点）
queryStrongLinked的Tarjan算法，这个就很少说了，由于你们应该都用了

最后MyNetWork的各个方法复杂度分析以下

MyNetwork.addGroup(Group)	2.0	1.0	2.0
MyNetwork.addPerson(Person)	2.0	1.0	2.0
MyNetwork.addRelation(int,int,int)	4.0	6.0	9.0
MyNetwork.addtoGroup(int,int)	4.0	2.0	5.0
MyNetwork.borrowFrom(int,int,int)	3.0	2.0	4.0
MyNetwork.compareAge(int,int)	2.0	2.0	3.0
MyNetwork.compareName(int,int)	2.0	2.0	3.0
MyNetwork.contains(int)	1.0	1.0	1.0
MyNetwork.delFromGroup(int,int)	4.0	1.0	4.0
MyNetwork.getGroup(int)	1.0	1.0	1.0
MyNetwork.getPerson(int)	2.0	1.0	2.0
MyNetwork.isCircle(int,int)	2.0	2.0	3.0
MyNetwork.MyNetwork()	1.0	1.0	1.0
MyNetwork.queryAcquaintanceSum(int)	2.0	1.0	2.0
MyNetwork.queryAgeSum(int,int)	1.0	3.0	4.0
MyNetwork.queryBlockSum()	1.0	1.0	1.0
MyNetwork.queryConflict(int,int)	2.0	2.0	3.0
MyNetwork.queryGroupAgeMean(int)	2.0	1.0	2.0
MyNetwork.queryGroupAgeVar(int)	2.0	1.0	2.0
MyNetwork.queryGroupConflictSum(int)	2.0	1.0	2.0
MyNetwork.queryGroupPeopleSum(int)	2.0	1.0	2.0
MyNetwork.queryGroupRelationSum(int)	2.0	1.0	2.0
MyNetwork.queryGroupSum()	1.0	1.0	1.0
MyNetwork.queryGroupValueSum(int)	2.0	1.0	2.0
MyNetwork.queryMinPath(int,int)	10.0	9.0	14.0
MyNetwork.queryMoney(int)	2.0	1.0	2.0
MyNetwork.queryNameRank(int)	2.0	2.0	4.0
MyNetwork.queryPeopleSum()	1.0	1.0	1.0
MyNetwork.queryStrongLinked(int,int)	5.0	7.0	10.0
MyNetwork.queryValue(int,int)	3.0	2.0	4.0
MyNetwork.renew(int,int)	2.0	7.0	7.0
MyNetwork.tarjan(int,int)	6.0	7.0	8.0

也能够看出来是qmp和qsl方法复杂度比较高，也是只有这两个方法含有图的反复查询操做

6、心得体会

坦白地讲，在作第一次做业时，我用了oo有史以来的最短期，并且我的感受没什么须要测试的地方，不禁感叹oo做业变简单了，在进行互测时，也是第一次认真看完了全部人的代码，并找出了他们的漏洞，感受第一次做业仍是比较注重规格的。

第二次做业，虽然形式与第一次相同，但忽然讲究的多了起来，也开始对时间和算法有要求了，但因为当周的os做业太难搞，我仍是放松了对oo的优化及测试，致使我出了一个很大的bug没有进互测！！！真的没有想到中测忽然变得如此简单。。我是大大的失策了，再加上双重循环的遍历，挂掉了全部强测。

第三次做业，我吸取了前两次的教训，本身对算法和测试都比较认真地规划了，并且我也能感觉到第三次做业十分看重算法，难度甚至大过了数据结构，此次的结果还算比较正常，也因为优化程度不够致使TLE了一些点，并且互测的大佬们也查出了我没注意的很小的点，通过最艰难的一次bug修复，我终于完成了这一单元的代码部分。

真的感触颇多，从这一次做业，我充分认识到了JML规格的实现不是纯”实现”的问题，要进行本身的优化，使程序效率达到最好，想一想这实际上是合理的，规格的书写者只负责想好方法的效果，保证规格正确性便可，不可能连咱们怎么实现都考虑到了。最后，再赞一句助教此次强测的点简直太妙了，就卡那一点点时间，我是挣扎着才由2.0XX秒到了1.9X秒，真是一次颇为“愉悦”的经历。。