GIT地址 | 点击查看 |
结对伙伴 | 陈纪龙201831061109 |
在阅读过做业要求后,想到了python中列表和词典的功能,词典的结构正好能够来存储记录单词频率和词组频率。但涉及到命令行操做的不怎么懂。
具体代码设计及编程思想体现过程请移步结对伙伴陈纪龙同窗的博客html
在代码编写后咱们进行了复审,针对函数的参数传递作了一些更改,让命令行参数与函数接口能更好的对接。同时在复审过程当中发现了本身在注释以及一些代码思路上的问题,在陈纪龙同窗的帮助下进行了改正。python
单元测试利用的是python自带的unitest部分进行测试。
过程以下
覆盖率统计本身下载coverage插件进行的代码覆盖率统计
在cmd命令行运行结果以下
这里的覆盖率结果查询资料后仍是不甚明了,不知道该怎么单元测试用例才能有效提高覆盖率。git
性能测试github
两个测试图像代表Wordgroup函数耗费最大。写这个函数的时候我想到的是利用列表能够连续读取的特性,利用循环将每次读取的区间进行更新,从而得到指定长度词组,。在利用join函数将列表读取出来的词组转化为字符串作为关键字。再利用词组的get方法获取词组出现的频率。
形成耗费大的缘由应该是循环中嵌套了对列表转字符串的操做以及对词组频率的统计
但愿能有更好的方法编程
运行结果ide
参考陈纪龙的博客函数
在这次结对编程做业中,陈纪龙同窗出了不少力,咱们两个都有python基础,可是在结对过程能够明显感受到伙伴的效率逼我高不少,我想是由于个人代码量较少,不少都没进行实际操做,看来实践是检验技术的惟一标准。在纪龙同窗的帮助下我收获了不少,包括学会了一些没学过的技术,以及面向对象的基础思想,最终顺利完成了这次编写做业,由衷地体会到告终对编程地“1+1>2”。
性能