验证码破解方法整理

  经常使用破解方法大体有如下几种: php

   1, 采集,去噪,二值化,滤波,调用Tesseract OCR,识别返回结果; java

    java 代码工程http://download.csdn.net/detail/ronghua_liu/6319701 程序员

   2,微软的东西Microsoft Office Document Imaging (MODI)作ocr识别。  c#

   c#代码工程http://download.csdn.net/detail/ronghua_liu/6319877 google

   3, Asprise OCR,这个是商业的 spa

   4,java ocr,这个没用过 .net


对于识别验证码的程序来讲,最可贵部分是验证字符的切割和特征码的创建,而国内不少程序员只作验证码时,老是喜欢在验证码加不少干扰素,干扰线,影响效果不说,还达不到很好的效果;因此,要想使本身验证码难于本识别,只作下面两点就够了 
1
 :字符粘连,最好全部的字符都有粘连的部分; 
2
 :不要使用规格字符,验证码的各个部分使用不一样比例的缩放或者旋转。
只要作到这两点,或者这两点的变形,识别程序就很难识别。咱们看看,
 yahoo  google 的验证码就知道,白字黑底,却很难被识别。
blog

Goole: get

 

yahoo:
it

碰到这种验证码,估计又够呛了。
相关文章
相关标签/搜索