201671010401包稚潼 实验二 词频统计软件项目报告

  • 需求分析

    (1)程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
    (2)程序须要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
  • 可行性分析

    (1)操做可行性:系统的操做方式可否在用户组织内行得通,词频统计所须要的资源有限。
    (2)经济可行性:从经济角度考虑,规划方案的实现性和开发的价值,本次是一个做业,不存在经济问题。
    (3)技术可行性:要考虑采用的硬件和软件可否知足用户需求。
  • 基本功能

    (1)指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
    (2)高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
    (3)统计该文本全部单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。
  • 环境需求

    1.测试机环境:Windows环境
    2.JDK版本:jdk8u161
    3.JRE版本:jre8u161
  • 功能设计

    1.新建文本文件data.txt而且统计各个单词出现的次数
    2.若是次数相同,安装单词的字典顺序排序,输出单词个数
    3.输入要查询的单词,显示它出现的次数 ,用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。.统计该文本全部单词数量及词频数
    4.输出结果并将其存储到result.txt文件中
  • 设计实现

    此软件有两个类:(1)WordCount.java主要实现文件的读入和选择对应的功能。根据用户输入的选择调用对应的方法。
    (2)方法在Tongji.java中,oneWord(取一个单词的频率),gaopin(根据用户输入的k值取高频词),out(将单词和词频数按字典顺序输入到result.txt文件)
    测试运行
  • 程序的运行截图以下图:
    • 单词个数统计:
    • 词频统计:

代码片断

输入英文文本

排序
java

  • 展现PSP

    任务内容 计划共完成须要的时间(min) 实际完成须要的时间(min)
    计划 10 9.5
    估计这个任务须要多少时间,并规划大体工做步骤 16 20
    开发 200 230
    需求分析 (包括学习新技术) 12 10
    生成设计文档 12 15
    设计复审 (和同事审核设计文档) 10 12
    代码规范 (为目前的开发制定合适的规范) 10 12
    具体设计 42 45
    具体编码 120 130
    代码复审 15 12
    测试(自我测试,修改代码,提交修改) 30 40
    报告 15 15
    测试报告 6 6
    计算工做量 5 3
    过后总结 ,并提出过程改进计划 6 4
    总结 本次项目对于java小白来讲很是具备挑战了,在同窗帮助下完成的不容易,大多数要求也未实现,在之后的学习中会更加努力的。编辑过程当中问题不少,须要继续努力。
    源码展现.
相关文章
相关标签/搜索