Tesseract-OCR 字符识别技术

1 概述 OCR(Optical CharacterRecognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。html Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,从新发布。支持多语言(包括英文,简体中文,繁体中文),支持多平台(包括Windows,Linu
相关文章
相关标签/搜索