深度学习目标检测IoU的思考(持续更新)

这段时间在做表格还原的工作,属于版面分析的一个模块。目前已经能做到截图/扫描/拍照表格图像检测,表格信息提取和html写入。可以多平台使用,不需要微软的接口。但在结合ocr的文本检测和文本识别确定表格内容的过程中,只通过单元格坐标和文本检测的坐标设定规则去判定文本是否属于该单元格具有较大的风险。一是极大依赖文本检测和表格坐标提取的准确度,二是,表格框和文本检测框的重叠方式有多种,规则难以自适应。所
相关文章
相关标签/搜索