ABBYY FineReader软件开发工具包解析

    ABBYY FineReader Engine是一款功能强大的光学字符识别(OCR)软件开发工具包(SDK),集成了ABBYY最早进的文档识别和转换软件技术,如:光学字符识别(OCR)、智能字符识别(ICR)、光学标记识别(OMR)、条形码识别(OBR)、文档影像和PDF转换。编程

        若是开发人员须要开发具备如下任一功能的应用程序,能够考虑使用ABBYY FineReader Engine软件开发工具包(SDK):浏览器

        •文档转换服务器

        •文件归档编辑器

        •文件分类工具

        •书籍归档开发工具

        •文本提取优化

        •字段识别网站

        •条码识别this

        •名片识别spa

       •图像预处理

       •扫描

        这个SDK中包含有十几个应用程序示例,包括C++、C#、VB.NET、VB、Delphi、Java和几种脚本语言(JavaScript、Perl和VBScript)示例。你能够查看代码开发库(Code Development Library)来快速入门,代码开发库中包含了SDK编程的各个方面。每一个截面代码库包含一个或多个代码片断并逐步描述了如何运行一项任务。

原文来自http://www.twain100.com/doc/3784

安装和设置

        在开发机上安装FineReader时有几个步骤。首先,必须安装受权服务器。若是只有1个开发人员使用SDK,此时能够将它直接安装在开发机上。若是多个开发人员要从多个工做站使用FineReader,此时应该将受权服务器安装在全部开发人员都能访问的应用程序服务器上。受权服务器必须安装在物理机器上,而不是虚拟机上。(请注意,该技术能够在虚拟机和云环境中运行)。经过受权管理器,您能够添加和激活您的许可证,不管您的许可证是试用版或购买的正品版本。

        接下来,能够将FineReaderEngine安装在开发机上,并链接到受权服务器。

        安装完成后,若是您使用的是Visual Studio2010或2012,此时必须再完成几个步骤,才可以使用可视化组件(控件)。这些步骤在其自带的SDK帮助文件“在不一样版本的Visual Studio中使用可视化组建”页能够找到。

        如今您就可使用SDK进行开发了。你能够按照上文代码开发库中描述的示例应用程序进行开发或你能够着手建立本身的程序。


建立项目

        首先,在C#或Visual Basic中建立1个新的Windows窗体应用程序。我在开发应用程序时使用的是Visual Studio2010。


ABBYY FineReader建立项目

        随后将ABBYY控件添加到Visual Studio工具箱窗口。我在工具箱中建立了1个新的ABBYY <section>。


将ABBYY控件添加到Visual Studio工具箱窗口


        将该项目的引用添加到ABBYY \Inc\.Net Interops\ 文件夹下的三个Interop DLL文件中,在安装过程当中,这三个文件都已注册并被添加到了GAC里面。


UI控件

       下面介绍设计视图Windows窗体中的五个ABBYY控件。

Windows窗体中的五个ABBYY控件

        从左上角开始,沿顺时针方向依次是:

        文件浏览器-该控件显示了从图像/文件加载的页面清单以及每一个页面的处理状态。这些页面能够显示为缩略图或详细信息视图。

        图像浏览器 –应用程序用户能够经过该控件来查看和编辑在文件浏览器中选中的页面。

        文本编辑器 –用户可使用文本编辑器查看和编辑FREngine在指定页面中识别出来的文字。

        动态浏览器 – 用户可使用该控件来放大或缩小图像浏览器中选定的区域。

        文本校验器 – 用户可使用该控件来调整扫描和验证过程当中未能识别的文本区域。这也是用于文件拼写检查的用户界面。

        在这些控件中,将文件和页面同步是很是简单的事情,只需将每一个控件添加到代码中的ComponentSynchronizer对象便可:

// Attach components to Synchronizer

Synchronizer =new FineReaderVisualComponents.ComponentSynchronizerClass();

Synchronizer.DocumentViewer = (FineReaderVisualComponents.DocumentViewer ) documentViewer.GetOcx();

Synchronizer.ImageViewer = (FineReaderVisualComponents.ImageViewer ) imageViewer.GetOcx();

Synchronizer.ZoomViewer = (FineReaderVisualComponents.ZoomViewer ) zoomViewer.GetOcx();

Synchronizer.TextEditor = (FineReaderVisualComponents.TextEditor ) textEditor.GetOcx();


引擎

        下面举个简单的例子,来讲明如何运用全部五个FineReader控件来打开窗体并加载PDF文件。

IEngine engine;

FRDocument document;

ComponentSynchronizer synchronizer;

IEngineLoader loader;

 

privatevoid LoadEngine()

{

   loader =new FREngine.InprocLoader();

   engine = loader.GetEngineObject("xxxx-xxxx-xxxx-xxxx-xxxx-xxxx");

 

   engine.ParentWindow =this.Handle.ToInt32();

   engine.ApplicationTitle =this.Text;

   document = engine.CreateFRDocumentFromImage((@"C:\Users\ABBYYTest\Images\Documents\DemoSample.pdf");

   synchronizer.Document = document;

}

 

privatevoid SyncComponents()

{

   synchronizer =new ComponentSynchronizer();

   synchronizer.DocumentViewer =(FineReaderVisualComponents.DocumentViewer)DocViewer.GetOcx();

   synchronizer.ImageViewer =(FineReaderVisualComponents.ImageViewer)ImgViewer.GetOcx();

   synchronizer.TextEditor =(FineReaderVisualComponents.TextEditor)textEdit.GetOcx();

   synchronizer.ZoomViewer =(FineReaderVisualComponents.ZoomViewer)zoomView.GetOcx();

   synchronizer.TextValidator =(FineReaderVisualComponents.TextValidator)textVal.GetOcx();

}

 

privatevoid UnloadEngine()

{

   // If Engine was loaded, unload it

   if (engine !=null)

    {

       engine =null;

    }

}

 

privatevoid DocumentForm_Load(object sender, EventArgs e)

{

   SyncComponents();

   LoadEngine();

}

 

privatevoid DocumentForm_FormClosing(object sender, FormClosingEventArgs e)

{

   UnloadEngine();

}



       固然,在实际应用中,您可能会建立一个按钮,用户经过点击这个按钮能够从文件系统中选择须要打开的文件。必须注意的是,卸载引擎很是重要。若是不这样作,就会占用您的工做站所得到的受权,直到手动将它从受权服务器中释放出来为止。咱们在进行COM交互操做……资源和内存管理很是重要。


识别 

       对加载的文件运行识别处理也是一件比较简单的事情。下面是管理该进程的方法:

privatevoid RecognizeDocument()

{

   FREngine.ProcessingParams processingParams =synchronizer.ProcessingParams;

 

   FREngine.DIFRDocumentEvents_OnProgressEventHandler progressHandler =

       newFREngine.DIFRDocumentEvents_OnProgressEventHandler(document_OnProgress);

 

   document.OnProgress += progressHandler;

 

   document.Process(processingParams.PageProcessingParams,

       processingParams.SynthesisParamsForPage, processingParams.SynthesisParamsForDocument);

 

   document.OnProgress -= progressHandler;

}



       progressHandler 可以让UI保持响应,并可以让用户启动“取消”命令,以终止某个长时间运行的文档识别进程。

本软件的默认识别语言是英语,若是您须要识别其余语言或任意语言组合的文档,你能够在打开文档前更改RecognizerParams中的SetPredefinedTextLanguage选项,步骤以下:

processingParams.PageProcessingParams.RecognizerParams.SetPredefinedTextLanguage(“ChinesePRC,English”);


导出

       要导出某个加载文件,能够调用文档对象的Export()方法。如下代码段将加载的文件导出到RTF文件:

synthesizeIfNeed();

Document.Export(fileName,FREngine.FileExportFormatEnum.FEF_RTF, null);


配置文件

       ABBYY FineReader Engine也支持“配置文件”,使引擎可以根据当前使用状况来优化进程。这些配置文件可使程序自行启动,并自动设置OCR质量的最佳的处理参数。下面是目前可用的配置文件:

       •DocumentConversion_Accuracy-在将文档转换为可编辑格式时优化其精确度。

       •DocumentConversion_Speed-在将文档转换为可编辑格式时优化其速度。

       •DocumentArchiving_Accuracy-在建立电子档案时优化其精确度。

       •DocumentArchiving_Speed- 在建立电子档案时优化其速度。

       •BookArchiving_Accuracy-在创建电子图书馆时优化其精度。

       •BookArchiving_Speed-在创建电子图书馆时优化其速度。

       •TextExtraction_Accuracy-在从文件中提取文字时优化其精度。

       •TextExtraction_Speed-在从文档中提取文字时优化其速度。

       •FieldLevelRecognition-识别短的文本片断。

       •BarcodeRecognition-提取条形码。

       • BusinessCardsProcessing–识别名片。

       • HighCompressedImageOnlyPdf–无损压缩文件,将全部文件以图片的形式保存。

 

       能够用Engine.LoadPredefinedProfile来加载这些配置文件。也能够经过.ini格式来建立自定义的用户定义配置文件。该软件自带的帮助文件中有详细说明,能够帮助用户建立自定义的配置文件。能够调用Engine.LoadProfile来加载自定义的用户配置文件。


其余平台和产品

        我只使用了FineReaderEngine的Windows SDK,但ABBYY也提供一些其余产品。FineReader Engine还支持Mac OS、Linux、移动SDK平台使用,其中FlexiCapture EngineSDK还能进行数据采集。经过ABBYY托管在Azure的云环境,开发者还能得到Web API。此外,ABBYY还有某些功能强大的、即装即用的OCR产品和数据采集产品可供用户选择。您能够访问他们的网站,查看他们的所有产品。

相关文章
相关标签/搜索