有了 iText,你截图,腾讯、Google OCR 帮你识别文字

好比,在看相似上面的扫描版 PDF 时,想要复制其中的文字,怎么办?手打?太累。试试我新开发的工具 iText 吧。html

iText 是 macOS 平台的 OCR 工具,自带截图功能,选择屏幕任意区域,便可识别其中的文字,又爽又酷。算法

识别后的文字已经复制到系统剪贴板,直接粘贴便可。微信

配合 ⇧⌘1 快捷键,使用体验更佳。固然,你也能够选择图片文件,或者将图片拖拽至 iText 的菜单栏图标进行识别。app

文字识别精准

你有没有这种印象:OCR 识别出来的文字有不少问题,还不如本身打字来得快。可见,识别的准确性很是重要,也是我很是在乎的一点。工具

腾讯、Google 双引擎

首先,我排除了离线的识别库,由于离线注定了这些库的识别能力是死的,不会本身加强。接下来,在一票在线 OCR 服务中,我对比了百度、腾讯、微软、Google 等大厂的产品,最后选择了国内使用腾讯、国外使用 Google 的组合。判断依据是什么?少许测试 + 主观倾向,好比不测我就以为 Google 比微软牛。测试

那么,到底识别准不许呢?这么说吧:优化

  • 对于通常的天然语言,好比书中的一段话、新闻稿,识别效果是惊人的准确,甚至能够达到 100%
  • 对于排版复杂、尤为有特殊字符的文字,好比程序代码、选择题,识别效果就不太理想,须要手动对识别后的结果进行修正
    • 好比,单纯地给一个竖线,机器是没法区分究竟是小写的 l、仍是大写的 I(顺便问一下,你看出两者的区别了吗?);与之相对,机器是须要根据上下文进行判断和优化的。而像程序代码这种非天然语言,机器目前是很难进行语义识别的

到底准不许?你不妨一试。.net

首创算法,进一步优化识别结果

OCR 服务还有一些欠缺,iText 针对性地作了这些优化:code

  • 自动识别段落
  • 中文环境使用全角标点符号
  • 中文与英文字母、数字间增长空格
  • 删除中文字符间、英文字符与标点符号间的多余空格
  • 英文首字母大写

若是你发现识别很差的地方,欢迎把图发给我,我会相应地优化算法,毕竟算法是须要数据喂养的,先谢。cdn

预览原图,方便校对

在目前 OCR 技术不能始终达到 100% 的状况下,预览原图、并进行修正,仍是有必要的。在 iText 中,你能够这样:

  • 将识别后的窗口拖到图片附近
  • 调用 iText 识别结果的 双栏模式:左侧展现图片、右侧展现识别后的文字

这样,就能够很方便地对照原图进行手动优化识别后的文字。

下载与付费

其实,不少场景都会用到 iText,好比 识别快递单上的号码、图片中的联系人信息、须要登陆才能复制的网页 等等,欢迎下载 iText 试试。

每个月可免费识别 20 次,订阅 iText 高级版便可无限次识别。首发期间,高级版限时 6 折优惠:¥3/月、¥30/年。关于收费模式,我非常纠结了一番。若是你准备吐槽,请先看下这篇文章再次纠结付费模式,此次是 iText

若是你以为 iText 还不错,还请帮忙 在 App Store 评论;若是你以为 iText 还能够改进,欢迎:

相关文章
相关标签/搜索