基于Faster-rcnn及FCN的中文OCR文本定位

启发 光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。通常分为两个步骤:文字定位,即找到文字在图片中的位置;文字识别,即识别出找到的文字。文字定位也可能包含一些二值化,矫正的步骤。git 文字定位常见的算法MSER +SVM或者MSER + CNN,是一种自底向上的方法:首先产出大量MSER区域
相关文章
相关标签/搜索