Form-OCR & CSDNAPP初体验

项目 内容
课程:北航2020春软件工程 博客园班级博客
做业:阅读并撰写博客回答问题 软件案例分析
我在这个课程的目标是 全面地评价一个软件
这个做业在哪一个具体方面帮助我实现目标 明确软件开发过程当中哪些方面须要注意

选择产品

选择的待分析产品:html

CSDN APP前端

智能表单信息抽取识别react

第一部分:调研,评测

CSDN APP体验

我在ios13系统的iphone7上,打开了CSDN的app。首先就能够看到,其界面是相对简洁的;首页的主要浏览内容是热门的帖子和博客,涵盖了技术、生活、感想、新闻等与IT行业紧密相关的各个方面。同时还有“学习”栏目能够加入付费的课程,“Blink”栏目能够关注大V们的动态……linux

我尝试着阅读首页的一些文章,使用了十几分钟后,产生了如下几点感觉:ios

  • 功能:app并非遇到问题后,快捷的查找解决办法的工具;而适合闲来无事的时候,在琐碎的时间里翻阅文章,长见识,作一些知识储备,更具生活性
  • 界面:看文章中的代码体验很难受,竖屏时屏幕宽度只有十几个字符,横屏时屏幕高度也受到限制,并且文本过小费眼睛。相比电脑,这点确实是手机的先天不足,没法弥补
  • 界面:文章最下端有很是多的类似文章的连接,致使要跳到文章末尾时十分不便,可能从屏幕最下端要往上拉好几个屏幕才能看到文章末尾的位置
  • 界面:APP动画比较流畅,查看文章时体验尚可,按钮设计不易误触
  • 数据量:图中能够看到,除了文章标题以外,下面有文章大约50字的节选能够带咱们一窥文章内容。可是像图中《生成随机数的方式你选对了吗》这样一篇文章,其摘要部分竟然是版权而不是对标题的解释,实属无效信息。我认为每篇文章发表前均可以增长一个大约50字的摘要,由做者填写,展现时附在文章标题下,以便游客了解文章大体内容。

在使用的过程当中,我还发现了一些小bug:git

  1. 切换到“个人”(见上图右下角)视图时,页面位置并不会自动定位到页面最上方,而是定位在一个偏中下的位置,而遮挡了头像等关键我的信息。若是我想要登陆,还须要手动把屏幕往上拉。我的怀疑是由于软件在不一样的手机上的适配状况不一样致使的。程序员

  2. 翻看评论时不能经过左滑退出,只能经过往下滑和点击X按钮退出评论区。若是看完最后一条评论时候,就必须往回滑动到全部评论的顶端以后再下滑以退出评论区;或者点击左上角的X按钮(但其实单手使用的时候按钮仍是比较远的)。github

CSDN APP打分

类别 描述 评分 (满分 10 分, 良好 6 分, 及格 4 分,聊胜于无 1 分, 不好 -3 分)
功能 核心功能 分析三个核心功能,功能设计和质量。 9
细节 有什么为用户考虑的细节? 6
用户体验 当用户完成功能时,不干扰用户 (例如: 是否不断弹出不相关广告)。 10
辅助功能 一些辅助功能如皮肤等 4
差别化功能 这个软件独特的功能. 它对用户的吸引力有多大? 7
软件的效能 占用内存, 启动速度, 内存泄漏状况 9
体验 软件的适应性 在联网/断网, 大小屏幕, 没有鼠标的状况下均可以顺畅操做. 和不一样平台的软件能流畅协做 9
成长性 记住用户的选择, 适应用户的特色,用户越用越方便 使用时间不够长,缺少体验
用户有控制权 系统状态有反馈,等待时间要合适。关键操做有确认提示,有明确的错误信息。 6

若是想要经过app查阅资料的话,效率并非很高,可是若是想要经过app来作知识储备,拓宽技术视野,了解一些行业前景和故事的话,相信app仍是可以很好的知足要求,尤为特别适合码农上下班挤地铁的时候看。web

OCR体验

Microsoft这个OCR-Form-Tools主要是用于识别表单中的信息,好比一张收据中的客户名、交易额、交易时间、卡号等等信息,前端在React-Redux框架下采用了Typescript编写。面试

搭建好环境以后,根据老师提供的数据库地址(Azure blob container)和表单识别模型服务(Form Recognizer service),本地的WEB前端链接上了远端的数据服务器。

在运行以前,首先须要标记一些训练集

能够看到咱们将一张收据中的有关信息用不一样颜色的框将其框起,而且赋予不一样的标签Tag,好比客户名Name、客户邮箱Email、客户地址Address、交易额Amount等等。

在这个页面,首先咱们须要点击右边的绿色Train按钮,让远端的模型加载上一页咱们所标注的标签Tag进行训练。训练后咱们获得一个ID为fdf40fdd-e809-4967-b1ee-763ca13507db的模型,以及该模型在训练集上的表现(此时咱们能够看到它对于训练集的拟合程度是100%,可以识别出全部的标签)

Result页面咱们能够上传一张本身的pdf文件,点击预测Predict白色按钮,咱们刚刚训练好的模型将会对上传的pdf进行分析,而且返回给咱们这张收据里面可以识别出的全部内容,好比客户名Name为Jamie Gonzales,客户的邮箱为jaimeg@outlook.com,客户的卡号Card Number为4867977021872331……

总的来讲,程序的运行效果仍是不错的,对于给定格式的pdf收据文件,可以不少好的分析出大部分的信息,很是有利于企业对交易进行自动化系统化的管理。

可是使用过程当中,有几点缺点,仍然可以让用户感觉到软件的开发还没有完成:

  • 使用卡顿,标注训练集的标签tag的时候,大约有1-2s的卡顿,彷佛是由于每个标注的操做都当即与服务器同步?个人建议是,让标注做为本地的功能而不是一举一动都传服务器。好比设计一个“标注状态”专用于标注,在用户标注完以后,能够退出该状态,而后再统一将全部的操做都上传。

  • 用户暂时没有办法上传本身的数据集。因为没有开放Azure blob container仓库,前端也没有提供响应的接口,用户没有办法使用本身的收据格式。建议添加这样一个接口和相应的文件管理功能,可以按类别分类收据,甚至能够训练模型对收据进行自动的分类。

  • 模型的识别率有提升的空间,好比上图日期Date的数据,就很明显出现了异常:出现了12/11 11/20 20这样的重复识别的问题。

  • 没有对不一样模型的管理功能。咱们训练的模型彷佛都是一次性的?

  • 导出json格式的时候,在个人环境下(archlinux x64, npm 6.14.3)必然会出现error

OCR打分

类别 描述 评分 (满分 10 分, 良好 6 分, 及格 4 分,聊胜于无 1 分, 不好 -3 分)
功能 核心功能 分析三个核心功能,功能设计和质量。 8
细节 有什么为用户考虑的细节? 6
用户体验 当用户完成功能时,不干扰用户 (例如: 是否不断弹出不相关广告)。 9
辅助功能 一些辅助功能如皮肤等 6
差别化功能 这个软件独特的功能. 它对用户的吸引力有多大? 8
软件的效能 占用内存, 启动速度, 内存泄漏状况 6
体验 软件的适应性 在联网/断网, 大小屏幕, 没有鼠标的状况下均可以顺畅操做. 和不一样平台的软件能流畅协做 9
成长性 记住用户的选择, 适应用户的特色,用户越用越方便 4
用户有控制权 系统状态有反馈,等待时间要合适。关键操做有确认提示,有明确的错误信息。 4

虽然OCR的评分看起来并非那么好,那是由于本人以一个完整的企业软件做为标准来看待这款开发中的软件,确实吹毛求疵了点,不过也许能说明软件的一些不足之处吧。

第二部分:分析

使用此服务的全部功能,估计这个软件/网站/服务作到这个程度大约须要多少时间(团队人数6人左右,计算机大学毕业生,并有专业UI支持)。

  • CSDN APP

    若是是一个雄心勃勃的创业团队,团队成员6人都有激情有动力去作好这件事情,我估计大约须要6个月开发测试而且最终上线。其中基本功能的开发分为大约3周的需求分析、架构设计,6周主要开发和3周测试。增量开发同理须要3个月。

  • Form-OCR

    本人的冯如杯项目和这个项目有几分类似之处。都是采用typescript的react-redux开发前端,使用某种后端框架运行模型,对图片(或者pdf)进行分析。个人冯如杯项目在4个懒惰的程序员的工做下,开发时间大约为2个月;考虑到熟练的6人团体的的话,前端开发能够1个月内完成(不知道Form-OCR用什么模型来分析表单,因此不清楚后端开发的时间);同时前端若是采用React Hook等“偷懒”方式的话,效率应该还会更好一些。

分析这个软件目前的优劣(和相似软件相比),这个产品的质量在同类产品中估计名列第几

  • CSDN APP

    SegmentFault(思否)彷佛web开发(包括前端后端集群等)的博文会比较多一些,其界面功能也更加简单简洁,比CSDN少了“朋友圈”、“打卡”,“任务”,“活动”等功能,多了问答的功能。技术色彩更强。

    itpub技术论坛的功能和CSDN相似,可是因为起步晚,其用户量和知名度明显不如CSDN。

    开源中国开源软件更加多一些,论坛偏向于开源软件的使用和修改。

  • Form-OCR

    暂时没有找到表单识别平台的相关工做

第三部分:建议和规划

首先,市场有多大?潜在的用户有多少?

  • CSDN APP

    IT行业市场之大,毋庸置疑。相信你们曾经或多或少都有在百度上查找一个bug缘由的经历,排在最前面的很大几率就是CSDN上面的博客。做为中国最大的IT技术社区,CSDN的用户受众从小白到从业者再到研发者,受众现在已达千万人(参考:2017年IT行业从业人员已达1950万人)。

    那么APP呢?其实我认为,APP的潜在用户要远远小于这个数字。主要缘由仍是据我对身边人的观察,CSDN这样的技术社区大部分时间仍是用来求助的:遇到问题时候,找到他人的解决办法;记录本身曾经犯下的错,帮助遇到一样问题的他人。若是不是真的热爱,并非全部人都愿意长时间看他人帖子学习知识的。

  • Form-OCR

    市场一样也是至关的大。尤为对于每一个公司的财务、对于银行前台,这绝对是一个福音。财务须要管理收据、银行前台须要录入客户的材料,乃至一切和收据、文件材料、银行水单等等有关的场景。预估潜在用户可达百万。

目前市场上有什么样的产品了,它们的优点劣势在哪里?和它直接竞争的产品在那里?

  • CSDN APP

    目前app store上,有CSDN、奇点日报、开源中国、SegmentFault这几个技术社区的app。我认为,CSDN最大的优点,也是其余产品难以望其项背的优势,就是其资源的丰富。足够开放、用户足够庞大、内容足够丰富,天然有更强大吸引力。

    我认为CSDN的劣势,也是它长期被人诟病的两点,是资源强制收费和抄袭现象泛滥。资源强制收费让不少想开源的玩家没有办法免费共享本身的资源;抄袭现象则说明了随着高手更加倾向国外的论坛,国内CSDN中技术水平通常的“伸手党”占比愈来愈大,博文质量愈来愈低。

  • Form-OCR

    暂时没有找到表单识别平台的相关工做

做为新的项目经理,这个产品的核心用户群是什么样的人,典型用户长什么样?学历,年龄,专业,爱好,收入,表面需求,潜在需求都是什么?

CSDN APP的核心用户群应该是IT行业的技术爱好者和从业者。典型用户应该分为如下几种:

  • 有一线经验的:

    • 乐于分享本身在技术上曾经遇到的问题,而且写成博客做为记念,并帮助行业的后来者
    • 应该是25-35岁之间,平时乐于钻研,而且在某个领域从业了足够长的时间,有本身思想风格
    • 表面需求是记录本身的实践经验并帮助他人;潜在需求是想让本身的文章被更多人看到,帮助更多人、获得更多的赞扬
  • 懂得行业规则的:

    • 30-50岁,应该曾经担任过HR、PM之类的职务,是管理型的人才
    • 乐于总结本身面试他人和管理时获得的经验,帮助行业人才发挥他们的才能
    • 表面需求是分享经验,帮助他人;潜在需求是让本身经验获得更普遍的分享
  • 热爱IT行业的

    • 20-30岁,紧跟时代潮流、乐于钻研的人,喜欢研究新技术学习新知识
    • 在CSDN的平台中,查找资料、学习知识、记录实践
    • 表面需求是利用博客帮助本身理解一个技术,提高自我;潜在需求是拥有更加直接系统的教程和带头人
  • 遇到困难的

    • 年龄不限
    • 表面需求是找到答案,解决问题,以继续本身的工做;潜在需求是但愿解决方法找的快一点。
  • 想找答案的

    • 年龄不限
    • 表面需求是找到答案,完成任务;潜在需求是增长学习过程当中的知足感,激发主动学习的热情。

Form-OCR的核心用户群应该是长期和表单打交道的人

  • 前台

    前台常常须要使用各类表单,银行前台管理客户交易请求、酒店前台登记顾客信息等

  • 医院

    能够很方便的读取和解析医院的报告单

  • 仓库

    能够便利的读取仓库的收据、货款记录,转化成电子信息便于整理和处理

  • 企业财务处

    企业的单据、发票等能够自动化地读取,转化为电子信息存储

  • 快递

    快递员在面对手写的快递单时,不再用人工录入了快递信息了

相关文章
相关标签/搜索