姓名前端 |
学号python |
杨浩政(组长)git |
3116004705算法 |
谢创敏网络 |
3116004478架构 |
钟伟机器学习 |
3116004711函数 |
李奕柱学习 |
3116004691测试 |
李晓阳 | 3116004641 |
肖洁銮(小小) | 3216004492 |
文本图像识别是机器视觉领域的重要研究课题之一。文本图像识别涵盖不少应用和任务,其中大部分起源于几十年前的文档数字化。利用原始图像数据实现其分类、识别、检索已经成为信息处理领域极其重要的研究内容。用户可以对图像文档进行更高层次的操做与理解,所以文本图像识别技术获得了愈来愈普遍的关注与应用。
(1)对不一样类型验单图像的识别
图像预处理能够消除图像中无关的信息,恢复有用的真实信息,加强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。所以对验单图像的预处理算法的选择尤其关键。以后经过对验单图像的特征提取等操做,用神经网络模型进行识别训练,提升识别率。
(2)分类获得验单中数据有效区域的ROI部分
对ROI区域进行处理和分析不但能够下降分析过程的复杂度,并且可以减小没必要要的计算浪费,因为每种验单的数据区域已经固定,因此决定采用阈值分割算法中的全局阈值法以及canny算子等一些边缘检测算法提取ROI区域并进行图像分割。
(3)对数据有效区域进行特征提取以及识别
对数据有效区域文本信息的检测的步骤通常为定位图像文本,将文本与背景分离最后进行识别并获取文本信息,在文字检测方面运用MSER算法和笔画宽度变换算法对数据区域进行检测,在文字识别方面使用卷积神经网络AlexNet模型进行训练并结合支持向量机的方法对样本特征进行分类。
(4)流程图
基础需求只须要提供接口给用户由那边调用接口来获取检测到的文字数据,但当验单类型增长则须要后台经过手动更新模型来知足验单识别。另外一种比较有难度的方案即是提供给用户一个图形界面,能够在图形界面上添加新的验单类型图片,输入标签,并提供接口作到能够在原模型的基础上迭代新模型,使得整个系统更加自动化与方便化。
(1)真实性
本项目处理的图像数据,来自于眼球检验设备的输出验单。
(2)可用性
本项目提供封装好的接口供用户使用,使其在输入验单图片后可以获取验单有效数据区域的文本格式文件并继续接下来对数据的操做。免去了医疗人员手工录入的繁琐操做,极大地提升了医生的效率。
(2)价值性
眼球做为人体生物特征的一个重要组成部分,包含着丰富的可用信息,在近年来获得了国内外研究者的高度重视和密切关注。同时眼球识别技术也获得了迅速的发展。眼球识别能够精确获取眼部疾病患者双眼信息,如眼球的位置区域、瞳孔中心、虹膜信息甚至视线方向等。而运用图像处理与模式识别技术对眼球验单以及数据区域进行识别,则能够将信息进一步进行处理,提取出各种相应的数据,使诊断和治疗过程更加自动化,节省了患者与医生的时间,提升效率。
(1)项目采用码云管理平台:项目地址
(2)拟定验单识别量:因为在初级阶段,验单数据集比较少,暂定20类验单。
第6周 |
1.团队组队、团队博客(✔) |
2.团队介绍、成员展现、角色分配、选题肯定(✔) |
|
3.制定团队计划安排(✔) |
|
第7周 |
1.需求规格说明书 |
2.原型设计,队员估计任务难度并学习必要的技术 |
|
3.编码规范完成、平台环境搭建完成、初步架构搭建 |
|
第8周 |
1.原型改进(给目标用户展示原型,并进一步理解需求) |
2.架构设计,WBS, 团队成员估计各自任务所需时间 |
|
3.测试计划 |
|
第9周 |
1. 团队项目Alpha任务分配计划 |
2. 连续7天的Alpha敏捷冲刺,7 篇 每日Scrum Meeting博客+代码提交 |
|
第10周 |
1.用户反馈+测试计划改进 |
2. 团队Alpha阶段我的总结 |
|
3. 团队项目Alpha博客:发布说明、测试报告、展现博客、项目管理 |
|
第11周 |
1. 团队项目Alpha博客:过后分析 |
2. 每一个团队有一人必须离开,本身寻找下一个接纳本身的团队。团队发博客宣布离队和接纳的成员。 |
|
第12周 |
1. 团队项目Beta任务分配计划,介绍新成员 |
2. 连续7天的Beta敏捷冲刺,7 篇 每日Scrum Meeting博客+代码提交 |
|
第13周 |
1. 团队项目Beta博客:发布说明、测试报告、展现博客 |
2. 团队Beta阶段我的总结 |
|
第14周 |
1. 团队项目Beta博客:过后分析, 宣布每人的贡献分 |
第15周 |
1.团队整个阶段总结,分析用户数据,整理文档,保证之后的团队能接手。 |
因为目前项目进展较为顺利,因此项目计划表暂无变动。
队员姓名 | 分工 |
---|---|
杨浩政 | 图像识别与文字检测算法方向总体把握,代码整合与优化 |
钟伟,谢创敏 | 尝试并实现文字检测的深度学习算法 |
李奕柱,李晓阳 | 验单类型图像识别代码的实现与整合 |
肖洁銮 | 协助后期实现用户界面操做 |
杨浩政:之前总以为拿到项目直接上手就能够,直接思考代码怎么写,如今发如今写代码以前有好多事情须要思考,尤为如今是团队合做,如何发挥团队中每一个人的才能与积极性很重要,一样重要的是关于整个项目的实现思路必定要多思考,怎样能够更快捷更方便,避免重复造轮子而写出效果最好的代码。
李晓阳:该项目以前就有接触过了,不过由于以前就暑假只学了一点基础知识,开学后也好久没碰过,因此基本得从头再学,如今仍是有不少不明白的地方,须要努力学习。但愿能够尽快上手,也但愿项目进展顺利。
钟伟:第一次接触这样的团队大项目,对于我我的来讲都是很大的挑战。通过你们的讨论,目前有了基本的方向,我也在积极的储备相应的知识。虽然有些知识挺难懂的,可是我相信花时间必定能够有所领悟,慢慢的作出点功能,在这个过程当中,本身对python的掌握会不断提升,经验也会不断丰富。
谢创敏:第一次接触机器学习,发现机器学习没有以前想象的复杂,但也不简单。一边学一边实践,愈加对机器学习产生了兴趣。虽然学习过程当中遇到不少困难,但也锻炼了本身解决困难的能力。期待此次项目能够带给我更多的经验和收获。
李奕柱:团队项目使用python+机器学习+opencv,我主要负责图像处理方面模块,虽然暑假对opencv有过一些了解,但目前还有许多问题不懂,也遇到了一些以目前我的水平难以解决的问题,接下来要好好深刻学习,争取在期限内把项目完成。
肖洁銮: 在此次的项目中,我主要负责前端页面的编写,在开发中,我深入体会到了沟通的重要性,并对某些理解不够深刻的知识点进行总结,期待在这此项目中,可以突破一些技术难点,有更多的收获。