Tesseract-OCR 字符识别---样本训练

  Tesseract是一个开源的OCR( Optical Character Recognition,光学字符识别)引擎,能够识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。 Tesseract最初由HP公司开发,后来由Google维护,目前发布在Googel Project上。地址为 http://code.google.com/p/tesseract-ocr/。
相关文章
相关标签/搜索