201671010424马玉琴实验二词频统计软件项目

1、需求分析
1.设计一个词频统计小软件,对给定的英文文章进行单词频率的统计。
2.文章中相应的标点不计入统计。
3.将统计结果以从大到小的排序方式输出。
2、功能设计
1.程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
2.程序须要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
3.指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数。
4.高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
5.统计该文本全部单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。
3、设计实现
1.读入哈利波特这个文档
2.用户输入想要查找的一个或者人一个英文单词,可出现该词在文中出现的频数
3.程序具备统计功能,能够按照文本中词频数降序显示词频以及单词
4.程序能够输出到文件中。
4、源代码地址:https://github.com/styleab/demo
5、测试运行


git

6、实验总结
由于是跨专业以前没有学习过计算机编程,独立完成这个做业很困难,并且此次时间很短只能完成老师布置的部份内容。老师把做业布置下来我从网上找了一些参考示例和资料,通过比较做业完成时间较短,在做业规定胡提交时间很难所有学会,并且没有编程基础,只能捉摸着写出一点点的代码,以及向同窗请教完成一部分。之后要利用空闲时间学习编程。
7、PSP
github

相关文章
相关标签/搜索