报纸PDF文字生成网页版,如何对比发现错误、掉字

在纸媒工作了几年,把纸媒转成内容可复制的电子版,也不是一个新概念,市场上也有很多的一些成熟产品。 但是,前期我遇到了自动识别软件,识别PDF后有掉字的现象,软件是自动化的机械化的,难免出错,出错后我们也需要去寻找解决办法,或许最先想到的是更换新的自动化生成软件,但是还是难保人为合并出错、软件识别出错等问题。 在工作时间中,我想到了可以做文字对比的方案,每天的几版报纸也不多,即使每篇文章都做一次对比
相关文章
相关标签/搜索