对于图像智能字符识别时,咱们处理的时候单纯的使用一种算法去识别时识别率是很是低的。而实际上企业或真实项目中的图片都是作过各类处理的,在这种状况下咱们单纯的使用一种方法,显得过于苍白。咱们在专题一种讲到的图片识别前的准备工做还有不少,只用专题二中的【二值化】、【噪声消除】还远远不够,这节咱们看一下【倾斜较正】和【字符切割】处理。算法
给你们几个例子还拿某互联网公司的电话号码来讲,他们选择了红色,并且图片的举例明显离得很近,这样的话明显给识别带来了难度(红色在调整阀值时反差不够明显,文字间距小识别就容易出错),对这种咱们能够采用字符切分,按照必定比例去切分图片(该方法适用性不是很强,须要先找到图片的规律,并且切割时容易切割错位。那为何还要讲,毕竟也是一种方法,在一些特殊状况这种方法仍是颇有效果的),切分后给各个图片编号。使用其余算法按照顺序单个处理便可。spa
eg:图片
图 一文档
图 二扩展
可能图一咱们按照必定的比例去切割在识别的时候仍是没有问题的。对于图二咱们按照必定比例切割时,上面提到的问题将都会出现。对于第二张图须要说一下图中绿色部分,白色是原图的底色,在分隔的时候就像图二同样在最后一次分隔时原图片剩余部分不够分隔比例时,这种图在分隔以前须要在原图上补充扩展底图,让其宽度是分割比例的倍数。这样可防止切割时最后一张图不切割的问题。互联网
这是使用物理切割的方法区识别,还有一些更高明的分隔算法eg:投影分隔、颜色聚类等分隔算法。有兴趣的朋友能够再去研究此类算法,再次就不赘述了。方法
在实际项目中如名片识别系统、身份证识别系统、车管系统等都会用到图片识别技术,而车管系统中对车牌照的识别,可能拍摄的角度、司机对车牌照悬挂的方式都有可能产生倾斜,倾斜图片对于图片识别影响很大,对于倾斜矫正有不少现成的方法,如Hough、OpenCV等技术都能实现。im
Hough变换可用于通常文档图像的倾斜校订。技术
OpenCV实现基于傅里叶变换的旋转文本校订 项目