tesseract-ocr的安装及使用

OCR (Optical Character Recognition,光学字符识别),是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。目前出现很多OCR技术(tesseract-ocr 、百度、腾讯、阿里等有推出OCR技术),但是老的OCR技术还是要了解下,最主要的是tesseract-ocr 开源。 目录 1
相关文章
相关标签/搜索