软件工程基础 微软OCR-Form-Tools体验

一点说明

这篇博客是软件工程基础(罗杰、任建)的第三次课程做业(我的项目做业)html

项目 内容
这个做业属于哪一个课程 软件工程基础(罗杰,任建)
这个做业的要求在哪里 做业要求的连接
我在这个课程的目标是 提高对软件工程的宏观和微观的全面认识,并加以实践
做业在哪些方面帮我实现目标 当了一把体验官!
个人教学班级 006

调研、评测

1. 下载与安装

2. 基本功能体验

使用10–30分钟这个软件的基本功能(请上传使用软件的照片web

在博客 OCR-Form-Tools项目试玩记录(二)产品评测 中,Mis Tariano详细介绍了软件的完整运行流程,我就再也不赘述了,这里仅分享一下本人的一些功能体验。浏览器

img
Tag标记
img
模型训练
img
模型测试
img
数据导出

3. 直击痛点?

解决了用户的问题么?软件在数据量/界面/功能/准确度上各有什么优缺点?用户体验方面有问题么?工具

  • 直击痛点:自主的Tag选择与训练、手写体的良好识别、Json格式的导出,我相信是目前为止PDF表单处理的最好解决方案之一;学习

  • 数据量:邹欣老师给出的示例中,仅用5例训练就能够获得较好的模型,很是nice;测试

  • 界面:微软家软件近几年来一向的扁平风,温馨简约又不失设计感,整个流程体验下来很是丝滑;大数据

  • 准确度:在我有限的测试中,除去一些小的数字重复的BUG(详见下文),没有发现其余的正确性问题,其对于表格中各项内容的识别拥有极细的颗粒度,没有出现其余OCR工具常出现的词语粘连的问题;网站

4. BUG在哪里

下载, 部署并体验软件的功能,按照描述的bug定义,找出至少2个功能性bug。用专业的语言描述(每一个bug很多于40字),若有必要,能够配图。.net

  • 功能性BUG设计

    • (Chrome浏览器)在 Tags Editor界面,使用 F11 快捷键进行全屏显示时,会弹出 “Type Error”的提示框。将提示框关闭后,发现其实能够正常全屏显示。(屡次尝试,可复现)

      img
      使用F11快捷键,弹出错误提示
      img
      点击OK后,发现界面其实成功地全屏显示
    • 侧边浏览区域不能拖拽缩放,可是有拖拽提示

      img
      当鼠标放置在边框处,会变成拖拽样式,可是根本没法对边框进行拖拽缩放
    • 对于number类型,偶尔出现的重复问题,这个重复彷佛是随机的

      img
      tag标注时,能够看到,日期的部分数字出现了重复
      img
      对训练出来的模型进行测试时,日期一样出现了重复
  • 广义的BUG(若是非得找出几个的话……)

    • 逻辑问题:鼠标放在Tag上,会显示出Tag的名字,这……原本就能够看到Tag的名字呀!我认为这里应该显示出更加有用的信息。

      img
      建议这里弹出有用的信息,如Tag的类型等
    • 缩放问题:在编辑窗口,鼠标滚轮滚动一下缩放的比例与点击一下缩放按钮缩放的比例不一样,前者是后者的3倍。这使得最便捷的鼠标滚轮缩放的跳动太大,变得不是很方便。

    • 仍是缩放问题:不管我怎么调整,文档都没法恰好填满编辑窗口……(强迫症患者退出直播间)

      img
      反复试探,都没法完美填满编辑窗口 :(

5. 结论(评价与意见)

总的来看,我给这个工具的评价为 “很是推荐”。

分析

1. 开发时间估计

使用此服务的全部功能,估计这个软件/网站/服务作到这个程度大约须要多少时间(团队人数6人左右,计算机专业的大学毕业生,并有专业UI支持)。

将一个项目打磨到如今这么精良,虽然功能专注,可是能够看出整个操做流程的细心考量,我估计须要2个月左右的时间。

2. 宇宙第一OCR?

分析这个软件目前的优劣(和相似软件相比),这个产品的质量在同类产品中估计名列第几?

相似的软件大都是面向企业用户的,如智慧云识-智能表单识别,我没法得到使用权限,因此就拿这个工具与我作笔记时经常用到的天若OCR比较一下:

  • 微软OCR部署在网站上,是经过网页进行交互的,而天若OCR有客户端,能够经过快捷键随时呼出,即时地进行识别;

  • 微软OCR是开源项目,无偿使用;天若OCR的商用是须要收费的,而我的用户要使用表格分列等功能则须要充值VIP;

  • 微软OCR目前的功能专注而强大,专一于PDF表单的识别;天若OCR支持更多的格式如图片,可是其识别出来的信息缺少规范;

    img
    天若OCR的表单功能须要充值,往后必定补上 :)

3. 冷静分析.jpg

你在第一部分发现的bug,为什么软件团队不能在发布前修复?他们是不知道,仍是有意不修复?你以为是什么缘由?

我发现的都是一些小Bug,并且大都属于见仁见智的问题吧,我猜想是由于对该工具的定位不一样,做为核心用户为企业而非我的的开源项目,这些小瑕疵是很容易被忽略的。

建议、规划

1. 市场分析

市场有多大?潜在的用户有多少?

每一个公司或政府单位都要有财务,都要有各类报表、考勤表等等表格的处理,在大数据时代,将纸质数据信息化已经成了必然趋势。传统的效率低、易出错、成本高的人工数据录入方式必然被时代所淘汰,当各类表格“上网”之后,对于这些表格的进一步处理就成了亟待有效解决的问题。仍是那句话,我认为微软表单OCR是当前最好的解决方案之一,市场空间巨大。

2. 用户分析

做为新的项目经理,这个产品的核心用户群是什么样的人,典型用户长什么样?学历,年龄,专业,爱好,收入,表面需求,潜在需求都是什么?

本开源项目的核心用户群应该是公司或事业单位,主要用于商业用途并且我的使用,整个使用逻辑都是为商业使用行方便的,好比项目彻底上Azure云(应该也有基于扶持微软自家云服务的考量),我的使用起来是很是麻烦的。那么对于商业用于来讲,他们的潜在需求就是更高的性价比了,或许学习成本并不十分重要。

3. 新的功能

功能:你要设计什么样的功能?为什么要作这个功能,而不是其余功能?为何用户会用你的产品/功能?你的创新在哪里?

我认为该开源项目切中了大量表单数据处理的痛点,拥有强大的深度学习内核,若是再拥有更加“傻瓜”的操做逻辑,必定会成为新的爆款应用。

  • Excel导出:其实这个功能能够很是简单地实现,毕竟即便将Json格式的数据导入Excel进行人工规范也是很是轻松的。可是若是有直接导出为Excel的功能,我想会让该工具适用更普遍的用户和使用环境,如今的使用门槛仍是有一些高的;
  • 自动生成Tag:这个实际上是“锦上添花”的功能吧,若是添加该功能,必须保证极高的正确性,不然自动生成所节约的时间所有又浪费在Tag的纠正上去了。

写在最后

第一次作一个软件的体验与测评,十分忐忑,写完之后,不由长舒了一口气……若有(必定有)纰漏,望指正。

相关文章
相关标签/搜索