朋友扔过来一张图片,说在整理试题答案,可是试题是图片,想从网上搜索答案一个一个敲太累了,能不能将图片里的文字提取出来?
我一看这是典型的OCR识别啊,直接祭出神器Tesseract.python
tesseract -l chi_sim 4.png stdout 目 二 画 口 “ 口 出
再对比原图一看
哦,不,是否是差的有点儿多?
怎么办呢?tesseract识别不利,确定是咱玩的不溜,为了识别几张图,再进行一通识别训练是否是有点儿浪费时间?如今都2020年了,各大厂商都提供这种文字识别服务,像我知道的百度都号称50000次/天免费
,就它了,开干
第一步 登录 https://login.bce.baidu.com/
须要百度账号,是偷是抢,各凭本事吧.
第二步 找到文字识别
服务
乖乖,这大厂,就是不同,产品真多.
第三步 建立一个应用当即建立
第四步 拿到AppID,API Key,Secret Keyide
下面是见证五行代码的时刻了
第一步 安装百度Python SDK3d
pip install baidu-aip
第二步 替换以前拿到 AppID,API Key,Secret Key并修改图片地址code
from aip import AipOcr APP_ID = 'xxx' API_KEY = 'xxx' SECRET_KEY = 'xxx' IMAGE_URL='~/4.png' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) with open(IMAGE_URL, 'rb') as fp: res = client.basicGeneral(fp.read()) for words_arr in res.get('words_result'): print(words_arr['words'].replace('.口','.').replace('.回','.'))
第三步 runblog
$ python ocr-baidu.py 四、知觉的特性包括() A.总体性 B.选择性 C.恒常性 D.间接性 E.理解性 五、注意的功能有() A.调节功能 B.维持功能 C.抑制功能 D.选择功能 E.启动功能
嗯 对比图片,比较完美, 收工!
that's all图片