Tesseract-OCR-03-图片文字识别

时间 2020-06-14

标签 tesseract ocr 图片文字识别繁體版

原文原文链接

本篇介绍使用 Tesseract-OCR 作图片文字识别，识别手写文字的时候，正确率能达到 90%，当训练后正确率是极高的。这里介绍的图片文字识别，能够识别英文，数字和中文等spa

Tesseract-OCR 图片文字识别

**Tesseract：**一款由HP实验室开发由Google维护的开源OCR，咱们能够不断的训练的库，使图像转换文本的能力不断加强；若是团队深度须要，还能够以它为模板，开发出符合自身需求的OCR引擎
若是尚未安装 Tesseract-OCR 请参考：
- Windows下 Tesseract-OCR 的安装与环境变量配置 https://blog.csdn.net/qq_40147863/article/details/82285920
固然配置环境也都下载上面那篇文章了，一步一图很详细

tesseract num1.jpg num1.net

这里 -l eng 是设置语言，不写的话，默认是 eng 也就是英语
结果：
注意：
- 1.这里若是报错 Tesseract 不是内部或外部命令，就是环境变量没有配置好参照： https://blog.csdn.net/qq_40147863/article/details/82285920
- 2.若是识别的图片文字是中文会提示，0个文字

**tesseract chi1.jpg chi1 -l chi_sim **3d

tesseract timg.jpg timgblog

<hr>- 本笔记不容许任何我的和组织转载图片