经常使用破解方法大体有如下几种: php
1, 采集,去噪,二值化,滤波,调用Tesseract OCR,识别返回结果; java
java 代码工程http://download.csdn.net/detail/ronghua_liu/6319701 程序员
2,微软的东西Microsoft Office Document Imaging (MODI)作ocr识别。 c#
c#代码工程http://download.csdn.net/detail/ronghua_liu/6319877 google
3, Asprise OCR,这个是商业的 spa
4,java ocr,这个没用过。 .net
对于识别验证码的程序来讲,最可贵部分是验证字符的切割和特征码的创建,而国内不少程序员只作验证码时,老是喜欢在验证码加不少干扰素,干扰线,影响效果不说,还达不到很好的效果;因此,要想使本身验证码难于本识别,只作下面两点就够了
1 :字符粘连,最好全部的字符都有粘连的部分;
2 :不要使用规格字符,验证码的各个部分使用不一样比例的缩放或者旋转。
只要作到这两点,或者这两点的变形,识别程序就很难识别。咱们看看, yahoo 和 google 的验证码就知道,白字黑底,却很难被识别。 blog
Goole: get
yahoo: it